2015-10-09 144 views
1

我對我的數據集使用sklearn.cluster.MiniBatchKMeans。我想找到「(1 /樣本數量)*(x(i) 與其聚類中心之間的平方距離的總和)」,如下圖所示。k均值聚類的成本函數

Cost function

有一個在 「sklearn.cluster.MiniBatchKMeans」 一個 「inertia_」。我在想, 「inertia_」 是計算這個數字?或者有沒有其他方法可以找到它。 感謝您的考慮。

+0

http://scikit-learn.org/stable/modules/clustering.html#k-means 看起來像是你想要的。但是,您可以計算訓練集中每個點與其中心之間的平方距離總和,以進行雙重檢查。 –

回答

0

這是正確的。根據他們的文檔,它們定義爲inertia

所以,從你的估計得到的慣性,搶sklearn.cluster.MiniBatchKMeans.inertia_