2017-03-04 40 views
0

我試圖分析包含近50,000條記錄的數據集。我將分析服務器和設置算法用於K-means。但問題是,大部分的記錄都是一個集羣(近48000條記錄)。然而,當我將其集成到不同的應用程序(如SPSS)時,它給了我可以接受的結果。我準備了數據集並刪除了異常值,但問題仍未解決。所以,我想問問是否有任何想法來解決這個問題?K-means sql server中的Singelton集羣ssas

回答

0

檢查this technical documentation文章。據此,「標準化」參數的默認設置假設數據的正態分佈;如果情況並非如此,則應更改此設置。

我不能肯定,如果這是你的問題,但...這個文件進行徹底的閱讀可以揭示這兩個算法implemetations之間的其他區別爲好。