我對一組序列文件運行K均值聚類算法。然而,所產生的結果如下所示:Mahout K均值聚類給我的結果就像0屬於聚類1.0:[]
0屬於羣集1.0:[]
0屬於羣集1.0:[]
0屬於羣集1.0:[]
0屬於羣集1.0:[]
0屬於羣集1.0:[]
0屬於cluste [R 1.0:[]
我使用的程序從NewsKMeansClustering.java,在亨利馬烏在行動的第9章給出的例子借來的。
想讓我知道爲什麼我會得到這種類型的結果嗎?這是由於任何特定的參數設置要求或其他?
在這個方案的核心集羣代碼
CanopyDriver.run(vectorsFolder, canopyCentroids, new EuclideanDistanceMeasure(), 250, 120, false, false);
KMeansDriver.run(conf, vectorsFolder, new Path(canopyCentroids, "clusters-0"),
clusterOutput, new TanimotoDistanceMeasure(), 0.01, 20, true, false);