2016-12-10 36 views
0

我正在嘗試使用大量搜索字詞獲取推文的語料庫。我遇到的一個問題是它無法獲得獨特的推文。也就是轉推。使用tweepy來獲得獨特的推文

有沒有辦法刪除這些事先沒有做任何文字處理?

我現在已經得到了什麼:

api=tweepy.API(auth) 
for search in hashtags: 
    for tweet in tweepy.Cursor(api.search,q=search,count=1000,lang="en").items(): 
     text=repr(tweet.text.encode("utf-8")) 
     out.write(text+"\n") 

回答

2

您可以添加:在您的查詢「 - 篩選銳推」只獲取原始鳴叫。也許不是最漂亮的解決方案,但它的工作原理。

api=tweepy.API(auth) 
for search in hashtags: 
    for tweet in tweepy.Cursor(api.search,q=search+" -filter:retweets",count=1000,lang="en").items(): 
     text=repr(tweet.text.encode("utf-8")) 
     out.write(text+"\n") 
相關問題