2016-05-12 54 views
7

我正在比較NLTK和Stanford CoreNLP,並發現後者具有用於情感分析的RNTN(遞歸張量神經網絡)實現。在線示例顯示,我們不需要訓練它,因爲它已經使用Penn TreeBank等大型數據集進行了訓練。NLTK是否具有用於情感分析的預先訓練的分類器

NLTK是否提供了類似的功能? 我問這個問題的原因是因爲我在網上找到的NLTK的任何實現都包括訓練一個特定的分類器,比如Naive-Bayes或MaxEnt。

P.S .:這是因爲Python易於使用,NLTK更受歡迎?我更喜歡Java,所以我應該選擇斯坦福CoreNLP或切換到NLTK + python

+1

這顯然是一個有偏見的意見,但我認爲如果你想在Java中做NLP我會建議使用斯坦福CoreNLP!這裏有很棒的文檔:http://stanfordnlp.github.io/CoreNLP/ – StanfordNLPHelp

+1

謝謝,StanfordNLPHelp :) – Yasen

回答

7

我發現NLTK已經有很多預處理功能。 例如,在此頁面的按鈕http://www.nltk.org/api/nltk.sentiment.html 中,您會發現適用於社交媒體的預處理情緒分析(查找「VADER」)。 如果相關,你也可以檢查: http://www.nltk.org/nltk_data/ 它提供了所有數據集合到NLTK中的完整列表,一些通過處理數據(所有類型的詞典,如着名的WORDNET)。 我對斯坦福核心NLP沒有任何經驗,所以我不能給出任何相關的比較。 無論如何,希望這些幫助:)

+0

謝謝。只要閱讀關於VADER方法的論文,它聲稱達​​到了與斯坦福核心NLP的遞歸網絡模型相同的準確度,但由於其簡單性,其計算能力和時間相對較少。我急於嘗試...斯坦福CoreNLP根據我的經驗做了更多時間來進行推特情緒分析 –