0
我經歷的K-means算法在象夫和調試時,我注意到,創建第一個羣集時,它這樣做下面的代碼:聚類分類和聚類政策
ClusteringPolicy policy = new KMeansClusteringPolicy(convergenceDelta);
ClusterClassifier prior = new ClusterClassifier(clusters, policy);
prior.writeToSeqFiles(priorClustersPath);
我讀的說明這些類和我不清楚...
我想知道這些聚類分類和政策是什麼意思? 它與分層聚類,基於質心的聚類,基於分佈的聚類等相關嗎?
因爲我不知道使用K-means mahout實現時使用此聚類分類器和策略的好處或原因。
非常感謝! Anony-Mousse,現在我看到了這個政策的原因。 然後,我將讀取其他K-means實現,例如R和Weka。 你能解釋更多關於這張地圖嗎?請減少開銷? –
順便說一句,在之前的文章中,您推薦使用ELKI或單個CPU的scipy實現。 但是你知道一些其他的平行k-means實現嗎? 謝謝 –
我不知道一個。我不認爲k-means對於這一點足夠有趣。請參閱:這是一種統計方法。在較大的數據上,結果仍然是一樣的,除了一點精度。 **大數據k-means完全沒用。** –