我有一個用Python編寫的文件,發送到Twitterstream並根據列表中的關鍵字獲取消息。名單很長,輸出不是我想要的。我想清理文件並將結果輸出到文本文件。輸出Tweepy TwitterStreamer到Python 2.7中的.csv
這裏是我當前的代碼,這將所有郵件寫入一行:
import sys
....
if __name__ == '__main__':
with open("keywords.txt", "r") as f:
keywords = f.readlines()
l = StdOutListener()
auth = OAuthHandler(consumer_key, consumer_secret)
auth.set_access_token(access_token, access_token_secret)
stream = Stream(auth, l)
stream.filter(track=keywords])
以上不拉任何東西,沒什麼意思是輸出到當我輸入一個文本文件,在命令如下提示python hashtagworking.py > output.txt
stream.filter
有大約300個項目,所以我想用一個txt文件來代替實際的文本。此外,每條消息的結果都顯示在一條消息中,我將其重寫爲輸出到消息中每個對象的csv文件。
我覺得這是我所期待的,但想確保:similar problem
我也想從其他嵌套對象之類的實體:{...}具體我想從實體對象獲取哈希標籤,但更具體地說是任何對象。我嘗試過的東西,如data.text.hashtag
data.entities.hashtag
data.entities.media.hashtag
都無濟於事。
謝謝@ketouem爲csv文件,我期待轉儲在代碼中被分隔的任何東西中,如果我有一天有5個元素,然後在第二天添加第6個元素,我希望第6個元素被添加。我將介紹你列出的文檔,我還必須弄清楚如何從「實體」部分中分解出元素,我可能必須定義一個函數,或者學習如何分解json。 –
我將代碼更新爲我正在處理的問題 –
請注意,您可以使用eponym(&builtin)模塊http://docs.python.org/2/library/json輕鬆操作原始json數據。 HTML – Ketouem