2010-12-10 44 views
2

有人會想知道Twitter上最大的用戶ID是什麼嗎?那到現在爲止,大約有2億用戶,那麼ID從1到2億的範圍呢?我發現在這個範圍內,一些id不被使用。最大Twitter ID?

我有一個Python腳本,基本上是訪問以下網址:

"/1/statuses/user_timeline/" + str(user_id) + ".json?count=200"

感謝,

回答

2

Twitter的API不保證user_id是單調遞增值。它只是一個「引用對象的永久唯一標識符」(來自API docs)。這意味着他們可能在未來重用ID(已刪除的用戶)或甚至以半隨機方式分配值。這些ID可能不會按順序分配。

讀入太多這個值,例如表示註冊用戶的數量可能不是很可靠。

+0

好的,謝謝,它看起來像我也應該使用`user_id`來防止與有效的id混淆。 – eWizardII 2010-12-14 08:54:51

+1

API連接斷開 – 2014-07-01 11:08:17

0

沒有人知道這一點。

有關於有多少用戶twitter真正具有的討論。

有很多的測試以及ID範圍等的探測

的結果是,IDS依次遞增的很長一段時間,但後來在他們之間的約10定期的差距,有時也似乎是完全隨機的。

我不知道如何準確地收集這些信息,目標是別的,但我認爲你明白了。

從技術角度來看,我期望網絡中沒有像twitter這樣大的東西。 我非常確定這些ID是分片的,這意味着它們被分配到特殊的服務器或服務器中。 所以,例如,如果你的ID等於mudolo 17我知道我必須看看那臺服務器。或者在那個國家。或者其他的東西。

或者,當新用戶註冊以避免複製問題時,maby服務器只有自己的前綴或殘留類來分配id。

在大多數情況下,它也是不常見的,或者「不那麼酷」來泄漏信息。 不要問我爲什麼,它只是我的經驗,即公司希望儘可能少地向外界展示信息。

這包括沒有可重現的transparanet id增量系統。

它也容易受到某種有害的攻擊,不必要的抓取,類似的東西。

所以我的觀點是。

沒有辦法給你一個可靠的答案。而且它不應該是必要的。 你應該設計你的應用程序處理eveyr可能的情況。

如果你想知道你有多大,你應該讓你的數據庫字段不會有任何衝突。

我認爲整數現在應該沒問題。(即使在32位系統上)

但始終準備升級。

尤其不要認爲它會保持數字。它只是一個獨特的字符串!

3

Twitter API的說,id是整數「大於53個比特」,以及一個64位的整數是安全的保持此值。

儘管如此,建議使用字符串表示id_str「保持安全」!?!