2013-06-11 55 views

回答

-1

那麼你可以使用WEKA均值在這裏,我發現something

您可以下載該項目以查看源代碼here

+0

這究竟是如何幫助一個算法,根本不使用點對點距離(矩陣或不)? –

1

K-意味着不能與一起使用距離矩陣。

因爲它從不計算/使用點對點的相似性! (另外,它可以在不到二次時間這種方式運行...)

相反,它計算分配對象聚類中心(從技術上說,這是歐氏距離平方的方差貢獻點對點中心;但您不應該在這裏實際插入其他距離。)並且,由於質心移動,您無法預先計算這些距離。

但是,存在變體的k-均值沒有這個限制,特別是K-冥王星又名PAM(查看維基百科)。這些不使用集羣中心,而是使用medoids(因此是名稱),它們是您的數據集的點。