2016-11-22 91 views
1

我做了特徵選擇後,具有18個維度的特徵,並將用於訓練分類器,RNN,HMM等。是否有必要在機器學習中規範化/標準化數據?

特徵包含stddev,加速度計和陀螺儀的平均值和派生值。 這些功能有不同的單位,規範化/標準化將失去功能的真正含義。

例如,一個特徵向量的單位是旋轉速度(度/秒),該特徵的值在-120和120之間。 另一個是x軸加速度的stddev,該值主要介於0和2. 如果我想做標準化,所有的特徵向量都將在0附近居中,負/正值分佈在零附近。 - >即使是stddev也會有負值!它完全失去了實際意義?

我在錯誤的軌道上嗎?任何信息表示讚賞!謝謝!

+1

這不適用於SO。反正你有anwser [這裏](http://stats.stackexchange.com/questions/189652/is-it-a-good-practice-to-always-scale-normalize-data-for-machine-learning) –

回答

-2

對於執行特徵縮放和規範化作爲預處理步驟,它甚至會受益於梯度下降(最常見的學習算法),即使在您的情況下它會很有用,但如果您有疑問,您可以執行交叉驗證。例如,當使用圖像和神經網絡時,有時在歸一化後特徵(像素)變爲負值,這不會使訓練數據失去意義。

相關問題