0
我正在嘗試使用大量搜索字詞獲取推文的語料庫。我遇到的一個問題是它無法獲得獨特的推文。也就是轉推。使用tweepy來獲得獨特的推文
有沒有辦法刪除這些事先沒有做任何文字處理?
我現在已經得到了什麼:
api=tweepy.API(auth)
for search in hashtags:
for tweet in tweepy.Cursor(api.search,q=search,count=1000,lang="en").items():
text=repr(tweet.text.encode("utf-8"))
out.write(text+"\n")