2013-05-17 85 views
0

我開始了一個項目,其中情緒分析將佔據重要位置。具體來說,我們將對Twitter,Facebook,YouTube和其他社交網絡數據進行情緒分析。使用Java進行自然語言處理(NLP)

我知道Apache的OpenNLP。看起來不錯,但我認爲除了它依賴於Hadoop之外,它還有點重量級。我以前沒有用過它,我的評估可能是錯誤的。

我在這個網站的其他地方看過關於斯坦福大學的NLP。我似乎無法從這個圖書館中獲得一個好的起點;一種教程。

此外,我已經閱讀了關於這個網站上的AlchemyAPI的Sentiment Anaysis API,但我想要一個我完全控制的解決方案。我只想要一個可以與我的應用程序綁定的庫。

在螺母殼中,我正在尋找一種輕量級的解決方案,並且可以在我的本地PC中進行設置。此外,非常感謝指向斯坦福大學NLP或OpenNLP的良好起點。

UPDATE:

我已經通過了UIMA文檔及其類似OpenNLP組件和其他第三方組件組件的支持了,除了其內置的文字處理能力,使其成爲一個有吸引力的起點。這是開放的架構讓我覺得它是我想要實現的理想選擇。額外的建議或意見將仍然非常感激。

+0

OpenNLP不依賴於Hadoop。我認爲它比UIMA更輕量級(儘管你無法真正比​​較它們)。 –

+0

我正在考慮從UIMA開始,然後在需要時插入OpenNLP。我還看到UIMA支持其他幾個文本處理組件。因此,我想從UIMA開始將使我在需要時利用這些組件。 – okello

回答

0

你也應該看看:

SenticNet

CLIPS

所有這些都是很容易與Python集成。你也可以使用NLTK,一個偉大的圖書館來做NLP。

+0

謝謝@George。這些鏈接非常好,可以在社交數據文本分析的許多方面爲燈光提供幫助。不過,我正在尋找一種基於Java或Scala的解決方案。 – okello