如何計算來自查詢的推文而不用重複計算？

我正在處理一個需要計算滿足查詢參數的鳴叫次數的項目。我在Python中工作，使用Twython作爲我的Twitter接口。如何計算來自查詢的推文而不用重複計算？

雖然有幾個問題，您如何記錄哪些推文已被佔？你會簡單地記下最後的推特ID並忽略它加上以前的所有？ - 這個最簡單的實現是什麼？

作爲另一個優化問題，我想確保櫃檯錯過的推文數量是最小的，有什麼辦法可以確保這一點嗎？

非常感謝。

2012-11-07 Sam

您可以考慮使用套件！他們防止重複。

一些僞代碼：

s = set() 
for tweet in tweets: 
    s.add(tweet.id)

2012-11-07 01:08:35

考慮類似的鳴叫和銳推的情況下，我會建議做一個語義紀錄的全部鳴叫，提取每個鳴叫的文本部分，做一個字典查找。但tweet id更爲簡單，帶有顯着的損失，如上所述。

2013-05-16 03:06:56 user14372

回答