2013-08-26 44 views
1

我正在嘗試寫一個Twitter4J作爲uni項目的一部分,但是我越來越掛斷了一些東西。從Twitter4J API:一些通用的Twitter4J問題

無效樣本()
開始偵聽所有公共 狀態的隨機抽樣。默認訪問級別提供了Firehose的一小部分。 「Gardenhose」訪問級別提供了比例更大的數據挖掘和研究應用程序,這些數據挖掘和研究應用程序希望更大的比例成爲統計顯着的樣本。

這意味着默認情況下,會爲該流提供「默認訪問」,但可以使用另一種類型的訪問「Gardenhose訪問」。它是否正確?如果是這樣,你如何訪問較高的Gardenhose訪問?

我在問,因爲我已經看到了一些關於SO的答案,提示只有一個訪問級別 - Gardenhose,我試圖徹底清除這個問題。

除此之外,我希望參考(如果可能的話)樣本流允許訪問的推文數量。我讀過很多人引用1%的「默認訪問」和10%的「gardenhose訪問」 - 但我無法在API中找到這個地方。

所以總結起來,有兩個問題:

  1. 是否樣品流有一個「默認訪問」和「gardenhose訪問」,或只是其中的一個?
  2. Twitter Firehose流中有多少可以獲得這些訪問級別?

如果回覆,請儘可能鏈接到可引用的API。

+1

爲了上天的緣故,如果你打算投降並投票結束,請有禮貌地說_why_。 –

回答

1

gardenhose不同於默認的樣本流,您將不得不從Twitter請求訪問才能使用它。

但是,我不確定Twitter是否仍然允許訪問gardenhose,或者即使它仍然存在。看起來目前的機制可能是使用Twitter的preferred data partners之一:

使用Streaming API?

每個Twitter帳戶都可以連接到一小部分Streaming API。需要增加訪問數據收集或分析原因的帳戶應查看我們的首選合作伙伴頁面。

source

這可能是students or educational instutions,而且gardenhose不同的是仍然可用。以前,您必須要麼電子郵件[email protected]或者你可以使用下面的form,但我不知道,如果這些方法還是工作 - 後很老。

至於推文的百分比,默認的樣品流允許訪問,我能找到的最好的參考是通過在開發者論壇Twitter的員工做了點評 - 重點煤礦:

我會建議只需使用1%樣本流https://stream.twitter.com/1/statuses/sample.json,您可以連接到您的Twitter帳戶。您不可能處於可以訪問所有數據的狀態,並且必須處理樣本。每天大約2.3億次推文,理論上你每天仍然可以獲得230萬條推文。

source

雖然,這同樣是一個老帖子。

關於流水流,如您需要被授權訪問它的文件規定,我相信很少有人可以完全訪問此流:

GET statuses/firehose

此端點需要特殊權限才能訪問。

返回所有公共狀態。很少有應用程序需要這種訪問級別。創造性地使用其他資源和各種訪問級別的組合可以滿足幾乎所有的應用程序用例。

總體文檔在不同的訪問級別稀缺,他們提供什麼,我建議您與Twitter的直接討論您的需求或聯繫其數據的合作伙伴之一。如果這不是你所希望的那麼具體,請道歉,祝你的研究成功。

+0

謝謝你。它和我希望的一樣詳細,並且真正回答我的問題。賞金的你的,享受:) –

+0

首選的數據合作伙伴鏈接似乎已經過時 –

+0

@aspiring_sarge它現在是最新的。謝謝你讓我知道。 – Jonathan