2010-09-23 69 views
13

我正在尋找一個java驅動的解決方案來分析句子來記錄一個關鍵詞是正面還是負面使用的需求。Java文本分析庫

即關鍵詞可能是「白菜」和一句話: -

「我喜歡捲心菜但不是豌豆」

而且我想某種登錄這是一個java句子解析正。 lucene(Hibernate-Search)庫可以用於這個嗎?

有什麼想法?

回答

16

您正在尋找「情緒分析」。一種可能性是LingPipe,誰友好link to their competitors also。 Jeff Dalton在his blog也有很多自然語言處理工具。

+1

這裏有很多東西。這將需要一些時間來篩選。我將重新報告我的發現 - 但非常感謝指針。 – jaseFace 2010-09-23 19:52:36

+0

是的,如果您發現任何有用的信息,請回報。 – ishnid 2010-09-23 20:52:53

0

看看Mahout Taste,它建立在Lucene上,但增加了很多開箱即用的功能。 (編輯)我應該補充一點,Mahout Taste只是相關到你要找的,而不是100%的匹配。

+3

(我是作者。)Taste是一個協作過濾引擎。封裝項目Mahout涉及更一般的數據挖掘,但不包括情感分析。 – 2010-09-26 12:10:24

1

我懷疑有這樣的事情。 Lucene肯定無法做到。

你甚至還可以定義「是否使用關鍵詞是正面還是負面」以可編程方式進行評估?要做到這一點,你必須分析文本的真實含義,這是一個甚至沒有被遙遠解決的AI問題。

我想你可以通過統計分析關鍵字是否更頻繁地出現在正面(好的,好的,好的,美妙的)或負面的(壞的,討厭的,糟糕的,可惡的)關鍵詞上來解決它,但即使在那裏,否定,諷刺和複雜的句子結構也會產生問題。

+0

我想起了一個以「精神樂意,肉體虛弱」爲開端的譯者,並以「葡萄酒很好,但肉腐爛」爲迴歸。 – 2010-09-23 13:13:27