使用mahout我能夠分類數據的情緒。但是我陷入了一個混淆矩陣。Mahout的情緒分析
我使用象夫0.7樸素貝葉斯算法進行分類鳴叫的情緒。 我使用trainnb
和testnb
樸素貝葉斯分類器來訓練分類器,並將推文的情感分爲「正面」,「負面」或「中性」。
樣品陽性訓練集
'positive','i love my i phone'
'positive' , it's pleasure to have i phone'
的負 和中性同樣地,我已經準備訓練樣本,它是一個巨大的數據集。
我提供的樣本測試數據tweets沒有包含情緒。
'it is nice model'
'simply fantastic '
我能夠運行mahout分類算法,它將分類實例的輸出作爲混淆矩陣輸出。
下一步,我需要找出哪些鳴叫都出現了積極的情緒和爲負。 使用分類的預期輸出:用情緒標記文本。
'negative','very bad btr life time'
'positive' , 'i phone has excellent design features'
在mahout中,我需要實現哪種算法以獲得上述格式的輸出。或者需要任何自定義源實現。
要顯示的數據「好心」提示我說,阿帕奇象夫提供的算法,這將是適合我的Twitter數據的情感分析。