我無法對單詞列表(文件2,製表符分隔符,兩個字符)進行tweets(文件1,標準twitter json響應)的情感分析專欄),分配給他們的觀點(正面或負面)。如何通過比較兩個文件中的字符串比較兩個文件來正確循環
問題是:頂部循環只運行一次,然後腳本結束,而我循環通過文件1,然後嵌套在那裏我循環通過文件2,並試圖比較並保持運行總和的情緒爲每個推文。
,所以我有:
def get_sentiments(tweet_file, sentiment_file):
sent_score = 0
for line in tweet_file:
document = json.loads(line)
tweets = document.get('text')
if tweets != None:
tweet = str(tweets.encode('utf-8'))
#print tweet
for z in sentiment_file:
line = z.split('\t')
word = line[0].strip()
score = int(line[1].rstrip('\n').strip())
#print score
if word in tweet:
print "+++++++++++++++++++++++++++++++++++++++"
print word, tweet
sent_score += score
print "====", sent_score, "====="
#PROBLEM, IT'S ONLY DOING THIS FOR THE FIRST TWEET
file1 = open(tweetsfile.txt)
file2 = open(sentimentfile.txt)
get_sentiments(file1, file2)
我花了好半天試圖弄清楚爲什麼它打印出沒有嵌套for循環file2的所有微博,但有了它,只有它處理第一條推文然後退出。
我不認爲這可能有更好的答案。謝謝。 – roy 2013-05-06 13:42:31