2012-11-07 55 views
1

我正在處理一個需要計算滿足查詢參數的鳴叫次數的項目。我在Python中工作,使用Twython作爲我的Twitter接口。如何計算來自查詢的推文而不用重複計算?

雖然有幾個問題,您如何記錄哪些推文已被佔?你會簡單地記下最後的推特ID並忽略它加上以前的所有? - 這個最簡單的實現是什麼?

作爲另一個優化問題,我想確保櫃檯錯過的推文數量是最小的,有什麼辦法可以確保這一點嗎?

非常感謝。

回答

1

您可以考慮使用套件!他們防止重複。

一些僞代碼:

s = set() 
for tweet in tweets: 
    s.add(tweet.id) 
0

考慮類似的鳴叫和銳推的情況下,我會建議做一個語義紀錄的全部鳴叫,提取每個鳴叫的文本部分,做一個字典查找。 但tweet id更爲簡單,帶有顯着的損失,如上所述。