2017-05-25 49 views
1

有沒有什麼有效的方式使用Python提取審覈的子課題的解釋和NLTK library.As爲例關於手機可能是「這款手機的電池是好的,但顯示是胡說八道」 我想上述兩種提取的用戶評價功能如如何使用python&NLTK提取評論的子主題句子?

"Battery is good" 
"display is a bullshit" 

上面的目的是要開發產品的功能相對於產品的評分系統。 分析極性部分已經完成。 但提取的審覈功能是一些困難me.But我找到了一種方法使用POS標籤圖案用正則表達式來提取功能,如

<NN.?><VB.?>?<JJ.?> 

這種模式爲子topic.But問題有可能是大量的根據用戶描述模式進行評論中的模式。

有什麼辦法可以有效地解決我的問題嗎? 謝謝!

回答

1

你提出的問題是多方面的,而不是直接的回答。

從概念上講,你可能要經過以下幾個步驟:

  1. 識別的手機的功能的名稱(+可能創建一個基於這些功能的本體)。

  2. 創建同義詞的名單功能名稱(類似的評價詞組,例如漂亮的,糟糕的,太爛了,等)。

  3. 使用NLTK標註器的一個解析評論。

  4. 創建的特徵提取及其評估(信息提取部分)的規則。我不確定NLTK是否可以直接支持你。

  5. 評估和改進的辦法。

或者:創造一個更大的標註語料庫和培養使用TensorFlow,Theano,或其他任何東西都就可以了深入的學習模式。

+0

我已經經歷了這些步驟,但事情是定義規則(根據你的步驟4)。可能會有不同的POS模式人們使用。有什麼方法可以自動生成這些模式(因爲我不需要提取選定的模式) –

+0

壞消息。爲IE創建規則通常是工作中最平凡的部分,很少有任何事情可以自動提取它們。這就是爲什麼深度學習在這項任務中找到如此多支持者的原因。 – sophros

+0

你能提一下這個任務的任何相關教程嗎?謝謝 –

相關問題