2011-06-02 33 views
1

我想將所有推特推文(是的,我瘋了),以便做出一些統計。 我沒有特別的許可,我只是一個簡單的twitter用戶。 首先,我只是測試它是否是可能的:我走我的服務器上,它有一個100Mbs的帶寬(我查了一下這是真的), 我運行此命令:Twitter流媒體API:帶寬是否有限?

curl -d 'track=http' http://stream.twitter.com/1/statuses/filter.json -umyuser:mypasswd | grep 'xxxxxx' 

我把'grep'只是爲了不顯示推文,並且由於在屏幕上顯示文本而沒有限制。 然後我用'dstat'來檢查使用的帶寬:它一直被限制在128KB/s(只有1Mbs)。由於推特權重大約爲2K,似乎我每秒只能傳輸大約64條推文......遠不及現實(我認爲超過1000條推文/秒)。 如果我在軌道列表中添加一些頻繁的項目,帶寬將保持128KB/s。

你有什麼想法獲得完整的流媒體嗎?

回答

1

除非您已被授予該權限,否則您無法訪問完全不受限制的firehose流。如果只有基本的權限,您將退居你現在在做什麼,使用filter,或使用sample(這將提供Twitter的鳴叫體積的大約1%。)

可以嘗試通過詢問,以獲得較高的訪問Twitter,但是他們似乎並沒有提高特權,除非你能證明你的用例非常好。