2011-11-28 19 views
2

我在嘗試構建提及特定主題的twitter用戶的社交網絡圖。我的策略大致如下:按主題從twitter用戶構建網絡圖

  1. 查詢Twitter的主題。收集出現的前100條推文,並將這些用戶添加到圖表中。
  2. 對於每個用戶:
  3. 檢索朋友和關注者。
  4. 查詢每個朋友/關注者的主題。如果他們提出了一個結果(意思是他們討論了這個主題),那麼將它們添加到圖中。
  5. 對於添加到圖形中的每個用戶,返回到步驟2,直到達到所需的搜索深度。

我的問題是雙重的。首先,這種方法很快超過了我的搜索API速率限制。即使搜索深度爲2,我很可能會發現擁有100多個朋友/追隨者的人,但在達到費率限制之前,我無法查詢他們。

其次,這一切都需要一段時間。 Twitter API並不快。在假設的事件中,我沒有限制速度,我可以異步提交請求,但我不禁想知道是否有更有效的方法。

我已經試過聚集請求到每個搜索深度一個查詢: 主題,從:名稱1或來源:名2 .... OR來自:對蝦

這基本上爆炸。我從twitter API獲得連接重置錯誤。如果我將查詢複製到twitter網頁,它只是坐了一段時間,然後說「加載推文似乎需要一段時間。」

我還通過電子郵件發送[email protected]以徵求建議/訪問權限增加,但目前爲止沒有回覆。

如果有人對如何通過twitter API收集這類信息有任何建議,我將非常感激。我目前使用twitter4j和java。

+0

我發現了一個頁面,其中有人試圖做同樣的事情,以我在做什麼:http://www.babelgraph.org/wp/?p=120 他只是撇去對話圖的最頂部,而不會延長搜索深度,並已經遇到一些速率限制問題。不是很有前途,但至少有更多的想法。 –

回答

1

您是否嘗試過僅僅使用過濾的流作爲主題,並使用提及轉發來構建圖形?這是非常間接的,並且仍然很慢,但不會達到任何速率限制。

http://truthy.indiana.edu/http://cnets.indiana.edu/groups/nan/truthy

+1

我最終做的是在最近的海報上搜索一個給定的主題。然後,我選擇其中的一小部分來建立以自我爲中心的網絡。現在我可以使用流媒體API實時監控創建的網絡。感謝您的輸入和優秀的鏈接! –