我使用Lingpipe的情感分析模塊實施了情感分析。我知道他們爲此使用了動態LR模型。它只是告訴我測試字符串是積極的情緒還是消極的情緒。我可以用什麼想法來確定表達情感的對象?使用Lingpipe在情感分析中識別實體
如果文本被歸類爲正面情緒,我希望得到表達情感的對象 - 這可以是電影名稱,產品名稱或其他。
我使用Lingpipe的情感分析模塊實施了情感分析。我知道他們爲此使用了動態LR模型。它只是告訴我測試字符串是積極的情緒還是消極的情緒。我可以用什麼想法來確定表達情感的對象?使用Lingpipe在情感分析中識別實體
如果文本被歸類爲正面情緒,我希望得到表達情感的對象 - 這可以是電影名稱,產品名稱或其他。
通常情感句子意味着這種句子的主體是這種情感的客體。所以基本的啓發式是NER並獲得第一個對象。否則,您應該使用深度解析NLP工具包並編寫一些規則將情緒與對象關聯起來。
雖然這個問題真的很老,但我想回答他人的利益。
你在這裏想要的是概念層面的情感分析。對於一個非常基本的版本,我建議按照以下步驟:
應用句子分離器。您可以使用Lingpipe的句子分配器或OpenNLP判定器。
應用部分展開標記。您也可以使用Lingpipe的POS tagger或OpenNLP POS Tagger。
然後,您需要通過POS標記器識別標識爲'名詞'的標記。這些標記有可能成爲句子中的目標實體。
然後你需要在句子中找到感情詞。要做到這一點的最簡單方法是使用帶有情感詞彙的字典。你可以在網上找到很多這樣的字典。
下一步將找出句子中的依賴關係。這可以通過使用Stanford Dependency Parser來實現。例如,如果你嘗試了一句 - 「這款手機是不錯的」他們online demo,你可以看到下面的「類型化依賴」:
DET(電話-2,這-1), nsubj(良好-4,電話-2), COP(良好-4,是-3), 根(ROOT-0,良好-4)
依賴性nsubj(良好-4,電話 - 2)這裏表示電話是標稱主體的標記好,這意味着單詞好表示爲電話。我相信你的情感詞典將包含單詞好的和電話將被POS標記器識別爲名詞。因此,您可以得出結論,情緒好被表達爲實體電話。
這是一個非常基本的例子。您可以更進一步,創建關於依賴關係的規則來提取更復雜的情感實體對。你也可以爲你的情緒術語分配分數,並根據該句中的情感詞的出現次數得出句子的總分。