2017-08-06 48 views
0

我試圖實現作爲方面礦工基於消費者評論在亞馬遜的耐用洗衣機,冰箱。這個想法是輸出方面的情感極性而不是整個句子。例如:'食物很好,但服務很差'評論必須輸出食物是積極的,服務是消極的。我閱讀了Richard Socher關於細粒度情感分類器的RNTN模型的論文,但我想我需要手動爲不同領域的詞組標記情感並創建我自己的樹庫以獲得更好的準確性。NLP看點採礦方法

這是我想到的另一種方法。是否有人可以通過您的反饋來驗證/引導我 將方法分解爲2個子任務。 1)識別方面2)識別情緒

識別方面

  1. 使用POS惡搞來確定所有的名詞。這應該在評論中列出 潛在的所有方面。
  2. 這些名詞的使用word2vec以確定類似的名詞和減小數據集大小

識別情緒

  • 列車一個CNN或評論密集網模型等級1,2,4,5(忽略 3,因爲我們需要的是有極性的數據)
  • 擊穿測試集評論到詞組(如「食物是好的」),然後得分它們使用上述模型
  • 查找第一個子任務中標識的方面並將它們標記爲 其各自的短語。
  • +0

    在這裏看到:https://stackoverflow.com/questions/45019446/identifying-multiple-categories-and-associated-sentiment-within-text/45025107#45025107 – polm23

    +1

    [識別多個類別和相關的情感的可能的複製在文本中](https://stackoverflow.com/questions/45019446/identifying-multiple-categories-and-associated-sentiment-within-text) – polm23

    回答

    0

    我不知道該如何回答這個問題,但有幾個建議:

    1. 採取neuralnets文學看看多任務學習並嘗試多任務的端到端neuralnet。
    2. 使用像w2v或glov這樣的預訓練詞向量作爲輸入。
    3. 當您使用互聯網數據時不要依賴於pos taggers,
    4. 找到一種方法來代表您的設計中的名稱實體和oov。
    5. 不要忽略3!
    6. 您應該定期註釋一些數據。