0
我正在構建一個簡單的分類器,它可以確定句子是否是肯定的。這是我如何使用textblob訓練分類器。Textblob邏輯幫助。 NaiveBayesClassifier
train = [
'i love your website', 'pos',
'i really like your site', 'pos',
'i dont like your website', 'neg',
'i dislike your site', 'neg
]
cl.NaiveBayesClassifier(train)
#im clasifying text from twitter using tweepy and it goes like this and
stored into the databse and using the django to save me doing all the hassle
of the backend
class StdOutListener(StreamListener)
def __init__(self)
self.raw_tweets = []
self.raw_teets.append(jsin.loads(data)
def on_data(self, data):
tweets = Htweets() # connection to the database
for x in self.raw_data:
tweets.tweet_text = x['text']
cl.classify(x['text'])
if classify(x['text]) == 'pos'
tweets.verdict = 'pos'
elif classify(x['text]) == 'neg':
tweets.verdict = 'neg'
else:
tweets.verdict = 'normal'
的邏輯似乎很簡單,但是當我訓練的分類哪一個是正還是負,應該與鳴叫到數據庫一起保存判決。
但這似乎並不是這樣,我一直在許多方面改變了邏輯,仍然沒有成功。問題是,如果推文是肯定的或否定的,則算法確實認識到它們是。
但是我希望它可以保存'正常',如果他們不是,它不這樣做。我認識到分類器只識別正面或負面的兩件事,但它肯定也應該確定一個文本是否不屬於這個範疇。
使用textblob時,這是如何實現的。示例替代邏輯和建議將非常感謝。
通常的方式來實現,將要創建一個三等:中性,結合實例。 –
我不認爲textblob接受第三類它給出了太多的值解壓錯誤 – johnobc
然後你可以創建兩個二元分類器,一個負與中性,另一個pos與中性。中性可能意味着「沒有情緒表達」或「平衡情緒」(儘可能多的負面情緒)。因此,有可能相同的實例被它們各自的分類器分類爲正面和負面(由你決定是否爲中性或者第四類,均衡) –