2016-11-18 71 views

回答

-2

您很難在細長的數據集中選擇一個初始聚類中心點,但它對結果有很強的影響。選擇不同的點時可能會得到不同的結果。

,當你選擇3個初始化點,你會得到在這種情況下,只有一個結果:

enter image description here

但它在拉長的數據集不同。

+0

選擇細長數據上的初始點並不困難。 –

0

如果您看目標函數,並且將x軸縮放10倍,則它變得更重要100倍。

對於「拉長」的數據,「長」維對結果有很大的影響,其他因素往往被忽略。

由於k-means是一種無監督算法,因此無法學習權重來對付這種情況。分類器(如線性SVM或決策樹)可以做到這一點,因此不存在此問題。