2012-10-13 192 views
5

我需要一個正面和負面的單詞列表,權重根據它們的強度和週數分配給單詞。我得到了:情感分析 - wordNet,sentiWordNet詞典

1.)WordNet - 它給每個單詞一個+或 - 分數。

2.)SentiWordNet - 在範圍[0,1]內給出正值和負值。

我檢查了這些上幾句話,

愛 - WORDNET是給兩個名詞和動詞0.0,我不知道爲什麼我覺得至少應該有些因素是積極的。

抑制 - wordNet給出-9.93
- SentiWordNet爲pos和neg兩者賦予 - 0.0。 (應爲陰性)

養神 - WORDNET - 2.488
- SentiWordNet - {POS - 0.125,負 - 0.5}(應爲正)

我需要一些幫助來決定使用哪一個。

謝謝。

+0

提供更好結果的那個。 :-) – Reactormonk

+3

你從WordNet獲得了積極的負面分數? – justhalf

回答

2

很多時候,度數和/或極性可能取決於領域和/或上下文,所以這個詞本身並不足以做出決定。

如果您有一些帶註釋的數據,我建議使用這兩種資源提供的分數作爲特徵來訓練分類器。如果您不這樣做,則有一種選擇是使用與所討論的域匹配的可用情緒註釋語料庫之一。儘管在無監督的情緒分類方法方面有大量工作,但我相信,如果沒有任何數據,整個任務就會變得有些棘手。 Unsupervised Sentiment Analysis

+0

關於上下文/域,我認爲如果一個詞有不同的情緒,它應該是一個不同的Wordnet感。例如。愛情#5(網球領域)vs http://sentiwordnet.isti.cnr.it/search.php?q=love的其他含義你有反例:一個詞在不同的語境中可以有不同的含義但不能有自己的Wordnet感? –

1

有是給予SentiWordNet不同意見的界面,如果你認爲他們是錯誤的: http://sentiwordnet.isti.cnr.it/search.php?q=repose

我下載了最新的3.1的WordNet,並檢查了file format documentation,並沒有看到任何情感提你提到的號碼。它也沒有在online search中顯示。

因此,出於這兩個原因,我建議與SentiWordNet一起!

(我看到你的問題是一歲,所以也許你能告訴我們你是去什麼用,爲什麼?)

-1

極性程度不僅對詞孤,但也要看Sentece或短語的上下文。 因此,如果對於同一個單詞有不同的結果,那麼這是因爲上下文有所不同。