我正在研究kmeans集羣。 我有3d數據集作爲no.days,頻率,食物 - >日是通過手段&標準偏差(標準差)或更好地說標準化。它給我的範圍[-2至14]機器學習,標稱數據標準化
- >頻率和食物是我的數據集中的NOMINAL數據通過DIVIDE BY MAX(x/max(x))進行歸一化,這使得範圍[0到1]
問題是kmeans只考慮日軸進行分組,因爲這個軸有明顯的間隙b/w點,並且幾乎忽略了頻率和食物中的另外兩個(我認爲是因爲可忽略不計的差距頻率和食物變暗)。
如果我只在日軸上應用kmeans(1D),我會得到與我在3D上應用的完全相似的結果(天,頻率,食物)。
「之前,我做了X/MAX(X),以及對天,但不能接受」
,所以我想知道有沒有辦法正常化頻率和食品的另外兩個標稱數據,我們可以得到基於DAY軸的公平縮放。
食品=> 1,2,3 頻率=> 1-36
你爲什麼沒有正常化所有的東西? – Mornor
我規範化了每一件事情......因爲我的定量數據和平均值和標準偏差都有意義,所以我使用標準化了......但是對於頻率和食品來說它沒有意義,因爲它們是我的分類數據。 –