2013-05-03 91 views
1

我試圖利用K-means clustering方法來解決類似於維基百科的問題。如何調整K均值聚類?

最小化正方形的內簇總和(WCSS):

但在我的製劑內-羣集模塊的總和必須被最小化。

給出了一組整數X和簇數k。需要選擇k個簇整數mu的值,以使得差異模塊的簇內總和最小化。

我正在積極做,隨機選取初始mu值,然後將其調整爲分配給羣集的元素的平均值。

但是,這種方法只給出簡單測試用例的正確答案。

+2

你是什麼意思「這種方法只給出簡單測試用例的正確答案」? K-means方法如你所描述的那樣工作:在下面兩個階段之間循環,直到中心不再改變:1.計算新的mu's 2.將每個元素分配到最近的中心。 – JonesV 2013-05-03 15:51:37

+0

這個問題與Java有什麼關係? – durron597 2013-05-03 15:53:14

+0

@ user1368342,我期望它最小化不是正確的效用函數。該維基文章指出,正方形被最小化。我的效用函數是不同的。 – 2013-05-03 15:54:10

回答

1

「正確答案」是什麼意思? K均值嚴格取決於初始條件(隨機選擇的初始平均中心)和數據分佈。不能保證你總能得到相同的分配中心。

+0

是的,我知道我並不總是收斂到最佳解決方案。所以我運行500/1000次並選擇最佳值。 – 2013-05-03 16:54:56