我是機器學習的新手。我正在嘗試使用MLlib的決策樹。mllib的輸入文件格式
有人可以幫助我如何爲多類別分類準備mllib決策樹的輸入文件。
我的CSV文件的擁有
標籤的格式,文字
label_1, text of label 1
label_2, text of label 2
label_3, text of label 3
通過mllib輸入所需的格式是LIBSVM,或labeledpoint。
fileformat中沒有允許的文本。問題是如何將文本映射到mllib所需的基於數字數據的文件格式,然後解釋結果。我正在使用java來實現。
問候
你認爲MLLib的TFIDF轉換嗎? – Anas 2014-10-10 08:14:45