我正在使用k-means和NGD(標準化Google距離)對術語進行聚類。 我有一個距離矩陣作爲k-means算法的輸入。 在這種情況下可以運行k-means嗎?你能建議任何源代碼嗎?java k-means使用距離矩陣的術語聚類
謝謝你在前進,
納斯
我正在使用k-means和NGD(標準化Google距離)對術語進行聚類。 我有一個距離矩陣作爲k-means算法的輸入。 在這種情況下可以運行k-means嗎?你能建議任何源代碼嗎?java k-means使用距離矩陣的術語聚類
謝謝你在前進,
納斯
K-意味着不能與一起使用距離矩陣。
因爲它從不計算/使用點對點的相似性! (另外,它可以在不到二次時間這種方式運行...)
相反,它計算分配對象聚類中心(從技術上說,這是歐氏距離平方的方差貢獻點對點中心;但您不應該在這裏實際插入其他距離。)並且,由於質心移動,您無法預先計算這些距離。
但是,存在變體的k-均值沒有這個限制,特別是K-冥王星又名PAM(查看維基百科)。這些不使用集羣中心,而是使用medoids(因此是名稱),它們是您的數據集的點。
這究竟是如何幫助一個算法,根本不使用點對點距離(矩陣或不)? –