使用NLTK3錯誤的文本分類？

我使用NLTK3阿拉伯語文本分類的工作。我有以下錯誤，可以請你幫我找出錯誤使用NLTK3錯誤的文本分類？

"calssifier =NaiveBayesClassifier.train(train_set) 
    File "/usr/local/lib/python2.7/dist-packages/nltk/classify/naivebayes.py", line 194, in train 
    for fname, fval in featureset.items(): 
AttributeError: 'unicode' object has no attribute 'items'"

感謝

來源

2014-12-19 n.a.s

錯誤消息

'unicode' object has no attribute 'items'"

意味着train_set是unicode，當它應該是items方法的字典式對象時。

要說更多將需要發佈minimal example惡魔般的錯誤。

使用

classifier = nltk.NaiveBayesClassifier.train(train_set)

來源

2014-12-19 19:50:55 unutbu

非常感謝！我在第六章跟着同樣的例子，我得到了準確性1.0，這是不可能的。我有一個不同的用例，我有一套訓練集作爲評論，每個評論都有其方面。我想要構建一個能夠確定測試評論方面的分類器。我將使用詞性標記作爲特徵。我構建了特徵函數，但我無法理解如何將特徵放入分類器中？，我注意到test_set也應該像train_set一樣形成字典！ –

請舉一個例子 –

train_set一個例子見chapter 6 of the NLTK book是一個字符串，當它應該是一個字典。

來源

2014-12-19 19:55:15 dmvianna

你可以舉一個例子 –

OP已經設置了'train_set =「something」'而不是'train_set = {「items」：「something」}''。微不足道的錯誤。 – dmvianna

使用NLTK3錯誤的文本分類？

回答

相關問題