1
我想檢測文本文章的某種情感傾向。這個問題似乎與分類問題有關,但我不想檢測每個類別的概率(負面,正面,中性),我想知道一些總體評分,如0.76
,然後將我的文章分類到涵蓋預定義範圍的類別中。 (,例如[0.75 ... 1)爲正數)。評估分數的分類算法
ml ml算法適用於這樣的問題?
我想檢測文本文章的某種情感傾向。這個問題似乎與分類問題有關,但我不想檢測每個類別的概率(負面,正面,中性),我想知道一些總體評分,如0.76
,然後將我的文章分類到涵蓋預定義範圍的類別中。 (,例如[0.75 ... 1)爲正數)。評估分數的分類算法
ml ml算法適用於這樣的問題?
據我看到它,你可以用這兩種方法之一做到這一點:
(p,1-p)
- 在p
是「機會」的二進制分類器賦予它「真實」。就個人而言,我會去的第一種方法與SVM,因爲我知道它處理大量的功能空間,以及 - 這很可能是在文本的問題的情況下。
那麼,你基本上在尋找二元分類器,它也給出了這個類是正確的概率?樸素貝葉斯和支持向量機支持 - 並且對於文本分類非常好(從我個人的體驗) – amit
@amit AFAIK樸素貝葉斯輸出是每個類的概率列表,而不是這個我只需要一個數字(例如[0 .. 1])可以代表文章評級。像電影評論等級的自動分類器一樣。 – mishadoff
你的訓練集是什麼?如果你的訓練集也是數字,你可以嘗試線性迴歸。 – amit