2016-03-02 104 views
-5

我從各種網站提取評論並將它們存儲在一個文件中,然後在senti-wordnet(它給出了某些分數)的幫助下將每個句子分類爲正面或負面。我使用python 2.7。我不知道它是如何工作的評論存儲在一個文件。有沒有人知道python的代碼呢?python中的情感分析

f1=open("foodP.txt","r") 
word_features =[] 
words = [] 

for line in f1: 
    word_features.append(line) 
    s=str(word_features) 
    tokens=nltk.word_tokenize(s)  

for i,j in nltk.pos_tag(tokens): 
    if j in ['VBN','VBP','VB','JJ', 'JJR', 'JJS', 'RB', 'RBR', 'RBS']: 
     words.append(i) 
print words 

這段代碼只給出我需要的形容詞,副詞和動詞。我想將這些詞分類爲正面或負面。

+1

請發佈您嘗試過的代碼。你寫的信息正是你想要的,但是你到目前爲止已經嘗試了這個論壇。 –

+0

我已經發布了我直到現在使用的代碼。 – lavanya

回答

1

你不需要POS進行情感分析,至少這不是必需的。通過使用X中的bag_of_words和Y中的「neg」/「pos」來準備特徵。然後分割成火車/測試集並應用分類算法 - NaiveBayes,MaxEnt,RandomForest,SVM。