0
我正在嘗試在數據使用上執行kmeans算法。運行時必須傳遞的選項需要一個到初始集羣的路徑。任何人都可以告訴我,即使在啓動算法之前,我們如何擁有初始簇?使用mahout進行Kmeans聚類
bin/mahout kmeans \
-i <input vectors directory> \
-c <input clusters directory> \
-o <output working directory> \
-k <optional number of initial clusters to sample from input vectors> \
-dm <DistanceMeasure> \
-x <maximum number of iterations> \
-cd <optional convergence delta. Default is 0.5> \
-ow <overwrite output directory if present>
-cl <run input vector clustering after computing Canopies>
-xm <execution method: sequential or mapreduce>
[這裏](http://unmeshasreeveni.blogspot.in/2014/11/how-to-run-k-means-clustering-in-mahout.html)是運行綜合控制數據的一個例子。 – 2014-12-08 03:38:20