無監督情緒分析

我一直在閱讀大量的文章，解釋在情緒分析系統真正起作用之前，被分類爲「積極」或「消極」的最初一組文本的需要。無監督情緒分析

我的問題是：有沒有人企圖對「正面」形容詞與「負面」形容詞進行基本檢查，並考慮到任何簡單的否定，以避免將「不快樂」歸爲正面？如果是這樣，是否有任何文章討論爲什麼這種策略不現實？

2010-10-13 Trindaz

一個classic paper by Peter Turney（2002）只用字說明了如何做監督的情感分析（正極/負極分類）的方法優秀和差作爲種子集。 Turney使用其他詞的mutual information與這兩個形容詞來達到74％的準確度。

來源

2010-10-14 13:52:24

這個人得到答案標籤。這是一篇非常有趣的文章。 – Trindaz 2010-10-15 12:38:45

我還沒有嘗試做過未經訓練的情感分析，例如你所描述的，但是我的頭頂上我會說你是在簡化這個問題。簡單地分析形容詞不足以很好地理解文本的情感;例如，考慮「愚蠢」這個詞。獨自一人，你會把它歸類爲負面的，但如果產品評論有'... [x]產品讓他們的競爭對手看起來很愚蠢，因爲先不考慮這個功能......'那麼在那裏的情感肯定會是積極的。在這樣的情況下，詞語出現的上下文肯定很重要。這就是爲什麼單獨使用未經訓練的書包方式（更不用說更加有限的形容詞）不足以充分解決這個問題。

預先分類的數據（'訓練數據'）有助於將問題從試圖確定文本是否具有正面或負面情緒從嘗試確定文本是否與正面文本更相似或消極的文本，並以這種方式進行分類。另一大問題是情感分析等文本分析常常受到文本特徵與領域特徵差異的影響。這就是爲什麼擁有一套好的數據來訓練（也就是說，你正在工作的領域內的準確數據，並且希望能夠代表你將要分類的文本）與建立一個好東西同樣重要系統用來分類。

不完全是一篇文章，但希望有所幫助。

來源

2010-10-13 06:35:03

感謝您的回覆華夫餅！我非常感謝所有關於此主題的意見。 – Trindaz 2010-10-15 11:57:27

我試着使用影響詞典來發現關鍵詞來預測句子級別的情感標籤。考慮到詞彙的一般性（非域依賴），結果只有大約61％。該論文可在我的主頁上找到。

在一個稍微改進的版本中，考慮了否定副詞。整個系統，命名爲EmoLib，可用於演示：

http://dtminredis.housing.salle.url.edu:8080/EmoLib/

問候，

來源

2010-10-13 07:33:56 atrilla

感謝您的這款酒吧。它爲我進行的測試運行得非常好。 – Trindaz 2010-10-15 12:02:09

大衛，