自從過去1年以來,我一直在進行文檔級情緒分析。 文檔級情感分析提供了完整文檔的感悟。例如 - 文本「諾基亞是好的,但沃達豐吸取大時間」將有一個負面的相關性,因爲它是不可知論的實體諾基亞和沃達豐。 如何才能獲得實體級的情緒,如諾基亞的積極因素,但沃達豐的消極因素?有沒有研究論文提供解決這些問題的方法?實體情緒分析
實體情緒分析
回答
您可以尋找實體及其推理,並且有一個簡單的啓發式方法,例如爲每個實體提供最接近的情感術語的情緒,也許在距離上最靠近依賴分析樹,而不是線性方式。每個步驟似乎都是一個開放的研究課題。
http://scholar.google.com/scholar?q=entity+identification
http://scholar.google.com/scholar?q=coreference+resolution
以及其他語言呢?或俚語和非結構化英語,其中依賴性分析樹是最可能的。不準確?是否有一些統計規則或其他方法? –
@HadyElsahar你提到的所有這些問題都是這個研究領域的主要挑戰。不同語言的特徵可以直接影響文檔分析過程。例如,波斯語在許多方面與英語不同。因此,您可能無法像英語一樣處理波斯語中的挑戰(例如,由於存在某些詞綴,Tokenizing在英語中相當簡單,但在波斯語中並不那麼容易)。而且,解析樹只是解決問題的一種選擇。您也可以使用其他方法作爲您的功能。 – Pedram
您可以嘗試看點級情感分析。已經做了很多努力來找到有關句子方面的意見。你可以找到一些作品here。您也可以進一步深入並查看與功能(方面)提取相關的那些論文。這是什麼意思?我舉個例子:
「屏幕質量很好,但是電池壽命很短。」
文檔級情感分析可能不會給我們這個文檔的真正意義,因爲我們在文檔中有一個正面和一個負面句子。但是,通過基於方面(方面級別)的意見挖掘,我們可以分別計算文檔中不同實體的感官/極性。通過這樣做特徵提取,在第一步中,嘗試找到功能(方面)在不同的句子(在這裏「質量的屏幕的」或簡稱「質量」和「電池壽命」)。之後,當你有這些方面的時候,你試圖提取與這些方面有關的意見(「好」,「質量」和「短」,「電池壽命」)。在研究和學術論文中,我們還將目標詞(用戶評論的那些詞或實體)的特徵(方面)和意見作爲意見詞,關於目標詞 。
通過搜索我剛剛提到的關鍵字,您可以更熟悉這些概念。
我也試過在這方面獲得研究文章,但沒有找到任何。我建議你嘗試使用基於方面的情感分析算法。我發現的相似之處在於,我們可以識別句子中單個實體的各個方面,然後找出每個方面的情感。類似地,我們可以使用相同的算法來訓練我們的模型,該算法可以檢測實體,就像它對各個方面進行檢測一樣,並找到這樣的實體。我沒有嘗試這個,但我會去。讓我知道如果這工作或沒有。還有多種方法可以做到這一點。以下是幾篇文章的鏈接。
http://arxiv.org/pdf/1605.08900v1.pdf https://cs224d.stanford.edu/reports/MarxElliot.pdf
我可以注意到這個問題是3歲嗎?不要說這個問題的進一步答案是不會被邀請的,特別是如果它可以使未來的讀者受益,但我認爲OP本身的建議有點太晚了,在這一點上是相關的。 –
- 1. 情緒分析與情緒分析
- 2. 情緒分析
- 3. lingpipe - 情緒分析
- 4. PIG:Twitter情緒分析
- 5. RapidMiner情緒分析
- 6. 斯坦福大學NLP情緒分析與實體識別
- 7. rapidminer和情緒分析
- 8. 簡單的情緒分析
- 9. 無監督情緒分析
- 10. Mahout的情緒分析
- 11. 情緒分析 - 覺醒
- 12. 情緒分析Google Prediction API
- 13. 用於情緒分析
- 14. 情緒分析詞典
- 15. 對實體的NLTK情緒
- 16. 評論數據情緒分析,重點提取負面情緒?
- 17. 使用LingPipe做分層情緒分析
- 18. 實時面部表情分類(情緒)
- 19. 情緒本體論
- 20. Twitter的情緒分析技術
- 21. 如何處理twitter情緒分析?
- 22. 使用senti_classifier和NLTK的情緒分析
- 23. 使用OpenNLP進行情緒分析
- 24. 情緒分析的培訓數據
- 25. nltk NaiveBayesClassifier培訓博客情緒分析
- 26. Twitter數據的情緒分析?
- 27. 使用word2vec的情緒分析
- 28. 情緒識別實時分析API調用
- 29. 在情感分析中檢測情緒python
- 30. 多維度情緒分析API,即積極性,情感性等
您可能希望尋找有關聲譽管理的文件。儘管如此,完全自動化是一個開放的研究問題。 –