2015-11-05 101 views
0

什麼是使用情感評級詞典來計算情緒的實際公式。我正在使用的詞庫包含範圍-5到5之間的評分。我想計算個別句子的情緒。要麼我必須計算句子中所有情感排序詞的平均值,要麼只是總結它們。什麼是情緒計算公式

回答

5

有幾種方法可以根據句子的評分情感成分計算索引。每個都是基於比較正面和負面的話,每個都有優點和缺點。

對於您的量表,衡量單詞中心傾向的衡量標準將是一個公平的衡量標準,其中分母即爲得分單詞的數量。這是下面採用的「相對比例差異」度量的一種形式。您可能不希望將所有情感詞的分數除以所有詞,因爲這會使每個句子的度量受到非情感詞的強烈影響。

如果您不相信您所描述的11分評級是準確的,您可以根據其符號將其分爲正面或負面。然後,你可以應用以下方法,你已經改變了 其中每個Pñ指正負編碼情緒詞的計數和Ø是所有其他詞的計數(使總字數= P + N + O)。

  1. 絕對比例差異。邊界:[0,1]

    情緒=(P - Ñ)/(P + Ñ + ö

    缺點:一個句子的得分是由非受影響情緒相關內容。

  2. 相對比例差異。邊界:[-1,1]

    情緒=(P - Ñ)/(P + Ñ

    缺點:一個句子的分數可能趨向於靠近非常強烈地聚集(因爲它們可能包含主要或唯一的正面或負面的內容)。

  3. Logit scale。邊界:[-infinity,+∞,

    情緒=日誌(P + 0.5) - 日誌(Ñ + 0.5)

    這趨於具有最光滑的性能,是圍繞零對稱。 0.5是更平滑的以防止日誌(0)。

有關詳細信息,請參閱William Lowe, Kenneth Benoit, Slava Mikhaylov, and Michael Laver. (2011) "Scaling Policy Preferences From Coded Political Texts." Legislative Studies Quarterly 26(1, Feb): 123-155.我們比較它們的性能測量左右的意識形態,但我們還討論了一切適用於正負情緒。

+0

絕對比例差異,(1)/N_? – salvu

+1

正確 - 分母N表示所有單詞,而其他地方表示否定。我會糾正的。 –