在每一個運行時下面的代碼給出不同的結果,同時聚類數據分成3份使用k均值方法:不穩定結果從scipy.cluster.kmeans
from numpy import array
from scipy.cluster.vq import kmeans,vq
data = array([1,1,1,1,1,1,3,3,3,3,3,3,7,7,7,7,7,7])
centroids = kmeans(data,3,100) #with 100 iterations
print (centroids)
三種可能的結果獲得的是:
(array([1, 3, 7]), 0.0)
(array([3, 7, 1]), 0.0)
(array([7, 3, 1]), 0.0)
實際上,計算的k均值的順序是不同的。但是,分配哪個k個點屬於哪個簇不是不穩定嗎?任何想法??
顯示所產生的集羣順序運行之間相同的是信息。謝謝! –