2013-05-02 134 views
0

我是WEKA的新手。WEKA如何計算平方誤差值或SSE的和?

我想知道如何WEKA得到他們簡單的K-means算法的SSE值?

我的朋友和我實現實現K-means算法一個java,並用相同的數據集,我們的Java實現的算法得到的只有大約400 SSE價值,同時WEKA得到2000年左右怎麼會這樣可能嗎?

我的朋友也說,WEKA使用K均值++。這可能是導致他們獲得不同結果的原因之一嗎?

任何想法將不勝感激。謝謝 如果有任何我說錯的話,請糾正我。我很想學習。

+0

您是使用交叉驗證還是僅使用列車/測試分割? – Steve 2013-05-02 18:32:50

+0

@steve你不用無監督的方法進行交叉驗證。 – 2013-05-03 10:14:50

+0

@ErichSchubert以爲他們以此爲:-) – Steve 2013-05-03 13:18:46

回答

0

你是否規範化了你的數據?

不同正常化將使兩不同的結果和不同SSE值。

也可以嘗試出口的結果,然後使用相同的實現來計算兩個SSE值。

+0

分類框架的一部分啊,也許這是問題,我們還沒有被歸我們的數據,並進行數據清洗和充塞感謝您的答覆 – 2013-05-13 12:37:10