2013-01-02 129 views
1

我想檢測文本文章的某種情感傾向。這個問題似乎與分類問題有關,但我不想檢測每個類別的概率(負面,正面,中性),我想知道一些總體評分,如0.76,然後將我的文章分類到涵蓋預定義範圍的類別中。 (,例如[0.75 ... 1)爲正數)。評估分數的分類算法

ml ml算法適用於這樣的問題?

+0

那麼,你基本上在尋找二元分類器,它也給出了這個類是正確的概率?樸素貝葉斯和支持向量機支持 - 並且對於文本分類非常好(從我個人的體驗) – amit

+0

@amit AFAIK樸素貝葉斯輸出是每個類的概率列表,而不是這個我只需要一個數字(例如[0 .. 1])可以代表文章評級。像電影評論等級的自動分類器一樣。 – mishadoff

+0

你的訓練集是什麼?如果你的訓練集也是數字,你可以嘗試線性迴歸。 – amit

回答

1

據我看到它,你可以用這兩種方法之一做到這一點:

  1. 使用classifcation算法,對二元分類它給你 (p,1-p) - 在p是「機會」的二進制分類器賦予它「真實」。
  2. 使用線性迴歸(或其他數值ML算法),並給它返回的分數 。訓練算法時,您將「pos」標記爲1,「neg」標記爲0。

就個人而言,我會去的第一種方法與SVM,因爲我知道它處理大量的功能空間,以及 - 這很可能是在文本的問題的情況下。