用於細長數據集的聚類K均值算法

-3

我在Matlab中編程K均值算法時遇到了問題。爲什麼K-means算法不適合對細長數據集進行分類？用於細長數據集的聚類K均值算法

這不應該是[交叉驗證]（http://stats.stackexchange.com）問題嗎？ – jeff

-2

您很難在細長的數據集中選擇一個初始聚類中心點，但它對結果有很強的影響。選擇不同的點時可能會得到不同的結果。

，當你選擇3個初始化點，你會得到在這種情況下，只有一個結果：

但它在拉長的數據集不同。

2016-11-18 07:16:49

選擇細長數據上的初始點並不困難。 –

如果您看目標函數，並且將x軸縮放10倍，則它變得更重要100倍。

對於「拉長」的數據，「長」維對結果有很大的影響，其他因素往往被忽略。

由於k-means是一種無監督算法，因此無法學習權重來對付這種情況。分類器（如線性SVM或決策樹）可以做到這一點，因此不存在此問題。

2016-11-19 08:20:18

回答