2011-01-26 47 views
4

意見挖掘/情感分析是自然語言處理的一個稍微近期的子任務。有人將其與文本分類進行比較,有些人對此採取更爲深刻的立場。你如何看待情緒分析(意見挖掘)中最具挑戰性的問題?你可以舉幾個例子嗎?情緒分析(意見挖掘)中最具挑戰性的問題是什麼?

+0

你能寫一句話什麼是你的查詢背後的動機?這會有很大的幫助。 – Skarab 2011-01-26 15:55:39

回答

18

的情感分析的主要挑戰是: - 命名實體識別

1) - 什麼是人實際上是在談論,例如300斯巴達人是希臘人還是電影?

2)回指分析 - 解決代名詞或名詞短語所指的問題。 「我們看了這部電影,去吃晚飯,太糟糕了。」 「It」是指什麼?

3)解析 - 句子的主語和客體是什麼,動詞和/或形容詞實際上指哪一個? 4)諷刺 - 如果你不瞭解作者,你根本不知道'壞'是壞的還是好的。

5)Twitter的 - 的縮寫,缺乏資金,拼寫差,標點錯誤,語法差,...

1

我認爲答案是語言複雜性,語法錯誤和拼寫。人們表達意見的方式有很多,例如,諷刺可能被錯誤地解釋爲非常積極的情緒。

2

我Hightechrider同意,那些身在何處情感分析的精度可以看到改進的地方。我還會補充一點,情緒分析往往大部分都是在封閉域的文本上完成的。試圖在開放域名文本上進行嘗試通常會導致精度/ F1度量非常差/你有什麼或者它是否是僞開放域,因爲它只考慮某些語法結構。所以我會說話題敏感的情緒分析,可以識別情境並基於此進行決策,這是研究(和行業產品)的一個令人興奮的領域。

我還會把他的第五點從Twitter推廣到其他社交媒體網站(例如Facebook,Youtube),那裏短暫的,不合語法的話語是司空見慣的。

0

這個問題可能過於籠統,因爲有幾種類型的情感分析(文檔級別,句子級別,比較情感分析等),每種類型都有一些具體問題。

一般來說,我與@Ian美世的答案達成一致,我還要加上其他3個問題:

  • 如何向縱深情緒/情感檢測到更。積極和消極是一個非常簡單的分析,其中一個挑戰是如何提取喜歡的內心有多少仇恨,多少幸福,多少悲傷等情緒
  • 如何檢測意見的對象積極的和意見是消極的對象。例如,如果你說「她贏了他!」,這意味着對她的積極情緒和對他的消極情緒,同時。
  • 如何分析非常主觀的句子或段落。有時甚至對於人類來說,很難就這種高度主觀的文本的觀點達成一致。想象一下電腦......