2015-02-11 42 views
1

我們可以使用樸素貝葉斯分類數值數據。我們有一個系統提取作者的風格,如句子長度,字長,並用它來預測匿名文檔的作者身份。因此,我們可以使用樸素貝葉斯根據這些數字數據對作者進行分類。否則你能否提出一個更好的選擇。使用樸素貝葉斯數字屬性

回答

1

是的,你可以。事實上,我知道的每種學習算法都可以處理數字特徵:處理其他類型的數據時,必須先將其預處理爲數字數據。

我建議你也看看Support Vector Machines,Online Passive Aggressive ClassifiersTF-IDF weighting這個任務。

+0

你可以推薦一些python軟件包,我可以使用樸素貝葉斯的數字屬性 – 2015-02-11 10:07:22

+1

@ Nithin.P - 我喜歡scikit-學習最多。它包含我提到的所有內容以及樸素貝葉斯。看看它的SGDClassifier。本教程使用文本數據:http://scikit-learn.org/stable/tutorial/text_analytics/working_with_text_data.html – IVlad 2015-02-11 10:27:37

+0

謝謝! SK-Learn對我來說非常完美。 – 2015-02-16 03:12:12