2014-12-19 33 views
2

我使用NLTK3阿拉伯語文本分類的工作。我有以下錯誤,可以請你幫我找出錯誤使用NLTK3錯誤的文本分類?

"calssifier =NaiveBayesClassifier.train(train_set) 
    File "/usr/local/lib/python2.7/dist-packages/nltk/classify/naivebayes.py", line 194, in train 
    for fname, fval in featureset.items(): 
AttributeError: 'unicode' object has no attribute 'items'" 

感謝

回答

0

錯誤消息

'unicode' object has no attribute 'items'" 

意味着train_setunicode,當它應該是items方法的字典式 對象時。

要說更多將需要發佈minimal example惡魔般的錯誤。

使用

classifier = nltk.NaiveBayesClassifier.train(train_set) 
+0

非常感謝!我在第六章跟着同樣的例子,我得到了準確性1.0,這是不可能的。我有一個不同的用例,我有一套訓練集作爲評論,每個評論都有其方面。我想要構建一個能夠確定測試評論方面的分類器。我將使用詞性標記作爲特徵。我構建了特徵函數,但我無法理解如何將特徵放入分類器中? ,我注意到test_set也應該像train_set一樣形成字典! –

+0

請舉一個例子 –

1

train_set一個例子見chapter 6 of the NLTK book是一個字符串,當它應該是一個字典。

+0

你可以舉一個例子 –

+1

OP已經設置了'train_set =「something」'而不是'train_set = {「items」:「something」}''。微不足道的錯誤。 – dmvianna