掌握在象夫vectordump命令空聚類結果k均值算法

我已經安裝並啓動Hadoop和運行下面的命令掌握在象夫vectordump命令空聚類結果k均值算法

mahout seqdirectory -c UTF-8 -i Input_files -o seqfiles 

mahout seq2sparse -i seqfiles/ -o vectorfiles/ -ow 

mahout kmeans -i vectorfiles/tf-vectors/ -c initial-clusters -o kmeans-clusters -dm org.apache.mahout.common.distance.SquaredEuclideanDistanceMeasure -cd 1.0 -k 20 -x 20 -cl 

mahout clusterdump -dt sequencefile -d vectorfiles/dictionary.file-0 -i kmeans-clusters/clusters-1-final -o result.txt -b 10 -n 10

，當我打開我的Result.txt它給我

VL-1{n=2 c= all:1.00 
    Top Terms:

下面

是我的文本示例文本文件

John is working in London

請建議我如何獲得集羣˚F或我的示例文本文件

來源

2013-08-06 user2609542

只有一條線是不夠的。我做了一些破解

只需在文件夾Input_files中創建一個虛擬文件，虛擬文件在它。

它應該運行。請讓我知道，如果你得到更好的解決方案

來源

2013-08-15 08:40:05 Karm

掌握在象夫vectordump命令空聚類結果k均值算法

回答

相關問題