WEKA如何計算平方誤差值或SSE的和？

我想知道如何WEKA得到他們簡單的K-means算法的SSE值？

我的朋友和我實現實現K-means算法一個java，並用相同的數據集，我們的Java實現的算法得到的只有大約400 SSE價值，同時WEKA得到2000年左右怎麼會這樣可能嗎？

我的朋友也說，WEKA使用K均值++。這可能是導致他們獲得不同結果的原因之一嗎？

任何想法將不勝感激。謝謝如果有任何我說錯的話，請糾正我。我很想學習。

您是使用交叉驗證還是僅使用列車/測試分割？ – Steve 2013-05-02 18:32:50

@steve你不用無監督的方法進行交叉驗證。 – 2013-05-03 10:14:50

@ErichSchubert以爲他們以此爲:-) – Steve 2013-05-03 13:18:46

你是否規範化了你的數據？

不同正常化將使兩不同的結果和不同SSE值。

也可以嘗試出口的結果，然後使用相同的實現來計算兩個SSE值。

2013-05-03 10:16:13

分類框架的一部分啊，也許這是問題，我們還沒有被歸我們的數據，並進行數據清洗和充塞感謝您的答覆 – 2013-05-13 12:37:10

回答