對於一個研究項目,我想獲得最近3個月的Twitter消息。拋開技術挑戰,這可能嗎?通過使用某種緩慢輪詢機制來保持速率限制器在海灣?從Twitter獲取歷史數據
Twitter API聲明「客戶端可能通過頁面和時間線REST API計數參數請求最多3,200個狀態」每小時是否這些數據?每天?或...永遠不會消失?
有什麼建議嗎?這在理論上是可能的嗎?有人做過類似的事嗎?
謝謝! 馬爾科
對於一個研究項目,我想獲得最近3個月的Twitter消息。拋開技術挑戰,這可能嗎?通過使用某種緩慢輪詢機制來保持速率限制器在海灣?從Twitter獲取歷史數據
Twitter API聲明「客戶端可能通過頁面和時間線REST API計數參數請求最多3,200個狀態」每小時是否這些數據?每天?或...永遠不會消失?
有什麼建議嗎?這在理論上是可能的嗎?有人做過類似的事嗎?
謝謝! 馬爾科
Twitter臭名昭着地不會提供三週以上的「可用」推文。在某些情況下,你只能得到一個星期。你最好在未來三個月儲存推文。許多人正確地懷疑他們是否仍然堅持Twitter。
您是否在尋找任何推文?如果是這樣,請查看Streaming API的status/sample方法。流媒體API使用持久的HTTP套接字,這可能是一個痛苦的編程,但它是非常優雅的,當你得到它的工作。我建議設置一個腳本來將狀態/示例中的推文轉儲到數據庫中。短短几天之後,你應該有一個TON數據。
你可以使用搜索API,不給它一個搜索,返回最大的100每頁,然後通過每個頁面兩次拿到一分鐘(120次 - 一小時不到限速的30倍)。然而,如果我的數學是正確的,那麼可能會給你每小時720,000條推文......問題在於,Twitter在過去3個月中增加了約17.5億條推文。所以如果我的數學是正確的,那就需要2361天或6年才能完成。
您可以在Google Groups上的Twitter開發討論中提出這個問題,或者聯繫Twitter獲得白名單,以便每小時可以發出20,000個請求。
就我個人而言,我不認爲這是可能的。
DataSift聲稱擁有一個Twitter歷史數據API即將推出,您可以申請當其可用here通知。
這可能不存在,當你第一次提出這樣的問題,但「PeopleBrowsr」 API是爲這個完美的,你可以回去1400天有一個API調用:https://developer.peoplebrowsr.com/pb
希望幫助!
鎖孔可以讓你的歷史鳴叫以XLS或視覺儀表盤呈現出來。預覽僅對最近的幾條推文進行採樣,但是,如果您通過電子郵件發送請求,則可以請求歷史數據。
您可以閱讀使用GNIP的歷史PowerTrack工具twitter的歷史數據。它會讓你訪問所有的Twitter數據,因爲它是第一次推特,相當它是非常簡單的工具使用。
你可以得到免費的估計數據範圍和費用使用我公司建立了一個服務名爲Sifter。如果您決定購買數據訪問權限,則可通過我們的文本分析平臺DiscoverText獲得數據訪問權限,您可以在其中搜索,過濾,重複刪除,羣集,人工代碼以及對數據進行機器分類。
綜合概述:https://gwu-libraries.github。io/sfm-ui/posts/2017-09-14-twitter-data – Nemo 2018-02-18 18:15:18