2012-06-21 109 views
5

自從過去1年以來,我一直在進行文檔級情緒分析。 文檔級情感分析提供了完整文檔的感悟。例如 - 文本「諾基亞是好的,但沃達豐吸取大時間」將有一個負面的相關性,因爲它是不可知論的實體諾基亞和沃達豐。 如何才能獲得實體級的情緒,如諾基亞的積極因素,但沃達豐的消極因素?有沒有研究論文提供解決這些問題的方法?實體情緒分析

+0

您可能希望尋找有關聲譽管理的文件。儘管如此,完全自動化是一個開放的研究問題。 –

回答

3

您可以尋找實體及其推理,並且有一個簡單的啓發式方法,例如爲每個實體提供最接近的情感術語的情緒,也許在距離上最靠近依賴分析樹,而不是線性方式。每個步驟似乎都是一個開放的研究課題。

http://scholar.google.com/scholar?q=entity+identification

http://scholar.google.com/scholar?q=coreference+resolution

http://scholar.google.com/scholar?q=sentiment+phrase

http://scholar.google.com/scholar?q=dependency+parsing

+0

以及其他語言呢?或俚語和非結構化英語,其中依賴性分析樹是最可能的。不準確?是否有一些統計規則或其他方法? –

+0

@HadyElsahar你提到的所有這些問題都是這個研究領域的主要挑戰。不同語言的特徵可以直接影響文檔分析過程。例如,波斯語在許多方面與英語不同。因此,您可能無法像英語一樣處理波斯語中的挑戰(例如,由於存在某些詞綴,Tokenizing在英語中相當簡單,但在波斯語中並不那麼容易)。而且,解析樹只是解決問題的一種選擇。您也可以使用其他方法作爲您的功能。 – Pedram

7

您可以嘗試看點級情感分析。已經做了很多努力來找到有關句子方面的意見。你可以找到一些作品here。您也可以進一步深入並查看與功能(方面)提取相關的那些論文。這是什麼意思?我舉個例子:

「屏幕質量很好,但是電池壽命很短。」

文檔級情感分析可能不會給我們這個文檔的真正意義,因爲我們在文檔中有一個正面和一個負面句子。但是,通過基於方面(方面級別)的意見挖掘,我們可以分別計算文檔中不同實體的感官/極性。通過這樣做特徵提取,在第一步中,嘗試找到功能(方面)在不同的句子(在這裏「質量的屏幕的」或簡稱「質量」和「電池壽命」)。之後,當你有這些方面的時候,你試圖提取與這些方面有關的意見(「好」,「質量」和「短」,「電池壽命」)。在研究和學術論文中,我們還將目標詞(用戶評論的那些詞或實體)的特徵(方面)和意見作爲意見詞,關於目標詞

通過搜索我剛剛提到的關鍵字,您可以更熟悉這些概念。

0

我也試過在這方面獲得研究文章,但沒有找到任何。我建議你嘗試使用基於方面的情感分析算法。我發現的相似之處在於,我們可以識別句子中單個實體的各個方面,然後找出每個方面的情感。類似地,我們可以使用相同的算法來訓練我們的模型,該算法可以檢測實體,就像它對各個方面進行檢測一樣,並找到這樣的實體。我沒有嘗試這個,但我會去。讓我知道如果這工作或沒有。還有多種方法可以做到這一點。以下是幾篇文章的鏈接。

http://arxiv.org/pdf/1605.08900v1.pdf https://cs224d.stanford.edu/reports/MarxElliot.pdf

+0

我可以注意到這個問題是3歲嗎?不要說這個問題的進一步答案是不會被邀請的,特別是如果它可以使未來的讀者受益,但我認爲OP本身的建議有點太晚了,在這一點上是相關的。 –