3

我試圖實施樸素貝葉斯分類器進行情感分析。我計劃使用TF-IDF加權措施。我現在只是有點卡住了。 NB通常使用單詞(特徵)頻率來查找最大似然。那麼如何在樸素貝葉斯中引入TF-IDF加權測度呢?如何使用樸素貝葉斯實現TF_IDF特徵加權

+0

好是你能找到的出路,如何這是可以做到的,因爲,我也堅持有同樣的問題。我試圖尋找同樣的東西,但沒有確定的東西。 – 2016-05-19 12:07:41

回答

-6

您可以訪問the following blog詳細顯示如何計算TFIDF。

+0

錯誤的鏈接,請直接解釋你的意思。 – rjurney 2013-04-18 07:46:19

+0

不良鏈接!請發佈一個好鏈接。 – 2014-02-01 08:11:30

+0

錯誤的鏈接請修復它 – 2014-02-07 02:44:50

2

您可以在統計模型中使用TF-IDF權重作爲要素/預測變量。我建議使用gensim [1]或scikit-learn [2]來計算權重,然後將其傳遞給您的樸素貝葉斯擬合過程。

scikit-learn'使用文本'教程[3]也可能是有趣的。

[1] http://scikit-learn.org/dev/modules/generated/sklearn.feature_extraction.text.TfidfTransformer.html

[2] http://radimrehurek.com/gensim/models/tfidfmodel.html

[3] http://scikit-learn.github.io/scikit-learn-tutorial/working_with_text_data.html