2011-05-09 116 views
0

我有一組點,並且我想要羣集。我知道如何做正常的k-means算法。但我不想以'k'作爲輸入。假設如果我有點像 1,3,4,50,60,70,1000,10002,10004該算法應該將它們聚類爲3個羣集 C1:1,3,4 C2:50,60,70 C3 :1000,1002,1004 滿足集羣內元素之間的距離應該是最小的,並且集羣間的距離應該是最大的。隨機聚類算法

+0

你爲什麼使用隨機詞? – Gumbo 2011-05-09 07:51:34

+0

@Gumbo:因爲我不想把k作爲輸入,所以我簡單地稱之爲隨機聚類。這是否導致其他事情? – Navin 2011-05-09 08:03:42

+0

也許這有助於... http://www.slideshare.net/pierluca.lanzi/machine-learning-and-data-mining-08-clustering-hierarchical – mkn 2011-05-09 12:13:05

回答

0

決定k是一個問題,它使用許多聚類算法重複自己。你可能想要考慮譜聚類(和它的各種算法表親),它可以解決這個問題。然而,許多版本都使用k-means作爲最後一步,讓你回到原點(儘管不是全部)。

或者,有很多方法可以找到k的最優值,例如上面Denis提供的答案;這可能足以滿足您的需求。