2017-05-02 43 views
0

使用K均值聚類時,我刪除了獨立變量的前5位和後5位百分位數值,因此我在幾個數據點上丟失了數據。 現在我使用K均值聚類後,我得到每個數據點的聚類。我如何獲得先前由於異常值而被刪除的數據點羣集K表示聚類

回答

0

那麼只需執行具有異常值處理的整個K-means即可。一旦算法完成(在每次迭代中刪除異常值),您可以將它們分配回最近的羣集。這樣,聚類的含義不會改變,但異常值會得到合適的標籤。

+0

嗨,請告訴我如何將它們分配回集羣,因爲我必須使用多個變量來計算距離。另外,我應該計算距標準值還是正常值的距離 – Rahul