2015-01-17 43 views
-1

我打算從tripadvisor獲取一些評論數據,我希望能夠提取酒店相關方面併爲他們分配極性,並將它們分類爲負面或正面。什麼是方面級別情感分析的一些好工具/實踐?

我可以使用哪些工具來實現此目的以及如何和從哪裏開始?我知道有一些工具像GATE,斯坦福NLP,Open NLP等,但是我能夠執行上述特定任務嗎?如果是這樣,請讓我知道一個前進的方法。我打算使用Java作爲編程語言的選擇,並且希望使用一些API

另外,如果我繼續使用基於規則的方法或使用經過訓練的評論語料庫的ML方法,那麼還有其他一些方法徹底?

P.S:我是NLP新手,需要一些幫助才能繼續前進。

回答

0

斯坦福CoreNLP有很多的功能在一個封裝

  • POS標註器
  • NER型號
  • 情感分析
  • 分析器

但在Apache的OpenNLP包由

  • 句子探測器
  • POS惡搞
  • NER
  • 分塊

但他們不具有內置的功能,找出情感極性所以,你必須將自己的代碼傳遞給其他圖書館諸如此類SentiwordNet找出極性。

我用過的OpenNLP和斯坦福Core NLP。但是,對於這兩種情況,您都需要修改關於餐館域的情感語料庫。

+0

真的有必要擁有一個語料庫嗎?有沒有其他的資料可用?請原諒我的無知。我對所有這些概念都陌生 –

+0

您可能需要製作自己的語料庫,除非您可以找到與您的特定文本域(酒店評論)非常相似的內容。您可以通過存儲評論星評級映射來自動執行此操作。 –

相關問題