我嘗試過樸素貝葉斯分類器,它的工作非常糟糕。支持向量機的工作更好一些,但仍然可怕。大多數我讀過關於支持向量機和樸素貝葉斯的一些變種(n-gram,POS等)的論文,但他們都給出了接近50%的結果(文章的作者談論80%和高,但我不能得到相同的準確度在真實數據上)。良好的情感分析算法
除了lexixal分析,還有其他強大的方法嗎?支持向量機和貝葉斯假設這些詞是獨立的。這些方法被稱爲「袋子文字」。如果我們假設這些詞是相關聯的呢?
例如:使用apriory算法來檢測,如果句子包含「壞和可怕」,那麼70%的概率,句子是否定的。我們也可以使用單詞之間的距離等。
這是好主意還是我發明自行車?
你如何看待apriory算法和單詞之間的混淆? – Neir0
@ Neir0:我不會立即看到你想如何應用它。我也從來沒有見過嘗試對它進行情緒分析。我知道有些人用它來構造二次內核的近似值(大致稱爲「單詞關聯」),但是我會首先嚐試使用vanilla kernel SVM。 –
直接的方法是輸入帶有徽章neg或pos的標記。例如:「pos我愛我的媽媽」。在輸出結果中,我得到了「如果我們有愛和媽媽的話,那麼70%,我們有pos徽章」。當然,我們可以修改此方法以獲得更好的結果。 – Neir0