0
我正在關注一個在線教程(http://adilmoujahid.com/posts/2014/07/twitter-analytics/),儘管將python腳本編寫爲相同,但我陷入了困境。我並不精通python,並且很難理解地圖上的文檔(本教程中使用這些文檔)。現在我得到「valueError無法設置沒有定義索引的框架和無法轉換爲Series的值」,並且無法找出修復程序。我的印象是數據框會有3列。一個包含所有推文,一個包含提到facebook的推文,另一個包含提到微軟的所有推文。我也意識到,教程是兩歲,所以也許有一些不贊成使用的語法?任何幫助表示讚賞Tweepy。在python熊貓數據框中存儲tweet文本
import json
import pandas as pd
import re
tweets_data_path = "Desktop/twit_dat/tweet1.txt"
tweets_data = []
tweets_file = open(tweets_data_path, "r")
for line in tweets_file:
try:
tweet = json.loads(line)
tweets_data.append(tweet)
except:
continue
tweets = pd.DataFrame()
tweets['text'] = map(lambda tweet: tweet['text'], tweets_data)
tweets['Facebook'] = tweets['text'].apply(lambda tweet: word_in_text('Facebook', tweet))
tweets['Microsoft'] = tweets['text'].apply(lambda tweet: word_in_text('Microsoft', tweet))
def word_in_text(word,text):
if text == None:
return False
word = word.lower()
text = text.lower()
match = re.search(word,text)
if match:
return True
else:
return False
這裏是我使用的數據樣本: http://charon.kean.edu/~jonathan/exampledata.txt
我認爲將文本文件直接導入數據框並不需要將數據附加到列表中會更容易。如果您發佈原始文件的一些原始數據,我們可以嘗試幫助您。 –
@FabioLamanna謝謝,帶有原始問題的樣本數據的新鏈接 – overboard182