2012-10-08 100 views
4

我無法找到一個簡單的庫函數使用R進行k中心聚類,而我可以使用k-means(kmeans())和層次聚類(hclust())。K中心聚類使用R

是否有,使用R簡單的貪心K-中心集羣的庫函數,如this post

如果沒有描述 - 因爲我是新來的R - 一個將如何去實現它(我理解其中的邏輯 - 只要而不是如何在R代碼中實際編寫它)。

回答

1

從本博客文章中所描述的內容看,這似乎與用於k-means的許多播種策略之一類似。我不會真的稱它爲一種聚類方法,而是一個預聚類或類似的東西。

也許你應該看看R的flexclust包,我相信它有一些k-means變化和初始化,也許它有這個變種作爲一個初始化選項。或者它可能在http://cran.r-project.org/web/views/Cluster.html

請注意,總是選擇距離最遠的對象容易選擇異常值作爲聚類中心!看看例如k-means ++基於類似的想法,但稍微聰明一些(另外,它更好地支持隨機化,所以你可以嘗試多種不同的初始化)。或者,您可以選擇最接近(2k-1)/(2k)分位數的對象,這對於優秀的集羣中心來說可能是一個更好的猜測。