我正在處理一個需要計算滿足查詢參數的鳴叫次數的項目。我在Python中工作,使用Twython作爲我的Twitter接口。如何計算來自查詢的推文而不用重複計算?
雖然有幾個問題,您如何記錄哪些推文已被佔?你會簡單地記下最後的推特ID並忽略它加上以前的所有? - 這個最簡單的實現是什麼?
作爲另一個優化問題,我想確保櫃檯錯過的推文數量是最小的,有什麼辦法可以確保這一點嗎?
非常感謝。
我正在處理一個需要計算滿足查詢參數的鳴叫次數的項目。我在Python中工作,使用Twython作爲我的Twitter接口。如何計算來自查詢的推文而不用重複計算?
雖然有幾個問題,您如何記錄哪些推文已被佔?你會簡單地記下最後的推特ID並忽略它加上以前的所有? - 這個最簡單的實現是什麼?
作爲另一個優化問題,我想確保櫃檯錯過的推文數量是最小的,有什麼辦法可以確保這一點嗎?
非常感謝。
您可以考慮使用套件!他們防止重複。
一些僞代碼:
s = set()
for tweet in tweets:
s.add(tweet.id)
考慮類似的鳴叫和銳推的情況下,我會建議做一個語義紀錄的全部鳴叫,提取每個鳴叫的文本部分,做一個字典查找。 但tweet id更爲簡單,帶有顯着的損失,如上所述。