如何調整K均值聚類？

我試圖利用K-means clustering方法來解決類似於維基百科的問題。如何調整K均值聚類？

最小化正方形的內簇總和（WCSS）：

但在我的製劑內-羣集模塊的總和必須被最小化。

給出了一組整數X和簇數k。需要選擇k個簇整數mu的值，以使得差異模塊的簇內總和最小化。

我正在積極做，隨機選取初始mu值，然後將其調整爲分配給羣集的元素的平均值。

但是，這種方法只給出簡單測試用例的正確答案。

你是什麼意思「這種方法只給出簡單測試用例的正確答案」？ K-means方法如你所描述的那樣工作：在下面兩個階段之間循環，直到中心不再改變：1.計算新的mu's 2.將每個元素分配到最近的中心。 – JonesV 2013-05-03 15:51:37

這個問題與Java有什麼關係？ – durron597 2013-05-03 15:53:14

@ user1368342，我期望它最小化不是正確的效用函數。該維基文章指出，正方形被最小化。我的效用函數是不同的。 – 2013-05-03 15:54:10

「正確答案」是什麼意思？ K均值嚴格取決於初始條件（隨機選擇的初始平均中心）和數據分佈。不能保證你總能得到相同的分配中心。

2013-05-03 15:55:34

是的，我知道我並不總是收斂到最佳解決方案。所以我運行500/1000次並選擇最佳值。 – 2013-05-03 16:54:56

回答