2013-04-26 24 views
3

我想在Mahout中運行樸素貝葉斯分類器分類問題。
我到處搜索瞭如何格式化我的輸入,以及如何指定mahout的輸入,但沒有找到任何有用的信息。Mahout - 我如何格式化我的輸入樸素貝葉斯分類

這是甚至遠程有用的唯一頁面
What are the steps needed to use Mahout Native Bayes Classifier Algorithm?

但是,即使那裏的答案的作者似乎已經習慣稱爲TT自定義腳本,用於分析輸入。

如果有人在那裏知道如何給輸入Mahout的算法,請幫助..

回答

1

我發現下面的網站:http://chimpler.wordpress.com/2013/03/13/using-the-mahout-naive-bayes-classifier-to-automatically-classify-twitter-messages/

顯然,Mahout本身也提供了格式化幫助。有一個選項可以傳遞給名爲seq2encoded,seq2sparse,seqdirectory等的mahout二進制文件。我不知道關於它們的使用的許多細節。這個網站有更多:https://cwiki.apache.org/confluence/display/MAHOUT/Quick+tour+of+text+analysis+using+the+Mahout+command+line

我不認爲這會帶你一路,但希望它會有所幫助。編號1:https://cwiki.apache.org/confluence/display/MAHOUT/Creating+Vectors

EDIT2:http://www.datastax.com/dev/blog/apache-mahout-in-datastax-enterprise-building-a-classification-system