2011-09-29 67 views
2

我使用Lingpipe的情感分析模塊實施了情感分析。我知道他們爲此使用了動態LR模型。它只是告訴我測試字符串是積極的情緒還是消極的情緒。我可以用什麼想法來確定表達情感的對象?使用Lingpipe在情感分析中識別實體

如果文本被歸類爲正面情緒,我希望得到表達情感的對象 - 這可以是電影名稱,產品名稱或其他。

回答

0

通常情感句子意味着這種句子的主體是這種情感的客體。所以基本的啓發式是NER並獲得第一個對象。否則,您應該使用深度解析NLP工具包並編寫一些規則將情緒與對象關聯起來。

3

雖然這個問題真的很老,但我想回答他人的利益。

你在這裏想要的是概念層面的情感分析。對於一個非常基本的版本,我建議按照以下步驟:

  1. 應用句子分離器。您可以使用Lingpipe的句子分配器或OpenNLP判定器。

  2. 應用部分展開標記。您也可以使用Lingpipe的POS tagger或OpenNLP POS Tagger。

  3. 然後,您需要通過POS標記器識別標識爲'名詞'的標記。這些標記有可能成爲句子中的目標實體。

  4. 然後你需要在句子中找到感情詞。要做到這一點的最簡單方法是使用帶有情感詞彙的字典。你可以在網上找到很多這樣的字典。

  5. 下一步將找出句子中的依賴關係。這可以通過使用Stanford Dependency Parser來實現。例如,如果你嘗試了一句 - 「這款手機是不錯的」他們online demo,你可以看到下面的「類型化依賴」:

    DET(電話-2,這-1), nsubj(良好-4,電話-2), COP(良好-4,是-3), 根(ROOT-0,良好-4)

    依賴性nsubj(良好-4,電話 - 2)這裏表示電話標稱主體的標記,這意味着單詞表示爲電話。我相信你的情感詞典將包含單詞好的電話將被POS標記器識別爲名詞。因此,您可以得出結論,情緒被表達爲實體電話

這是一個非常基本的例子。您可以更進一步,創建關於依賴關係的規則來提取更復雜的情感實體對。你也可以爲你的情緒術語分配分數,並根據該句中的情感詞的出現次數得出句子的總分。