2011-09-27 111 views
0

我需要爲給定的一組關鍵字提取twitter歷史數據。 Twitter搜索API返回的推文不超過9天,因此不會這樣做。我目前正在使用Tweepy Library(http://code.google.com/p/tweepy/)來調用Streaming API,並且它工作正常,除非它太慢。例如,當我搜索「$ GOOG」時,有時兩個結果之間需要一個多小時。肯定有包含該關鍵字的推文,但它不夠快返回結果。有沒有更好的方法通過python訪問Twitter流api?

可能是什麼問題? Streaming API速度緩慢還是我的訪問方法存在一些問題?有沒有更好的方法來免費獲得這些數據?

回答

1

你需要多久?要獲取歷史數據,您可能希望無限期地保持流(流API允許)並在本地存儲流,然後從數據庫中檢索歷史數據。

我也使用Tweepy進行直播/過濾,效果很好。延遲時間通常爲1秒,Tweepy能夠處理大容量流。

0

流式傳輸API速度太快,只要您發佈它,我們就會使用twitter4j。但流式傳輸只能傳輸當前消息,因此,如果您在發送推文的時刻不收聽流式傳輸,那麼消息就會丟失。

相關問題