1
在this例如,我一直在線,唯一的培訓分類器的方法是通過對好的和壞的推文列表進行培訓。無論如何,要用單個壞詞來訓練相同的分類器,而不是必須有示例正面和負面的推文。NLTK NaiveBayesClassifier培訓
我覺得只用負面和正面的詞來訓練它會提供更多的數據,因此會得到更準確的結果。找到正面和負面的單詞列表與正面和負面的推文的許多例子相比更容易。
在this例如,我一直在線,唯一的培訓分類器的方法是通過對好的和壞的推文列表進行培訓。無論如何,要用單個壞詞來訓練相同的分類器,而不是必須有示例正面和負面的推文。NLTK NaiveBayesClassifier培訓
我覺得只用負面和正面的詞來訓練它會提供更多的數據,因此會得到更準確的結果。找到正面和負面的單詞列表與正面和負面的推文的許多例子相比更容易。
在這種情況下,您可以使用單個單詞而不是句子。
這樣,它將適合你提到的例子。
pos_tweets = [('love', 'positive'),('good', 'positive')]
neg_tweets = [('hate', 'positive'),('bad', 'negative')]
問題如果每個單詞來自詞典並且單詞的頻率未確定,您將如何衡量單詞? – alvas