2016-07-26 106 views
2

我有一組特徵在區間(-1,1)內。我正在尋找一個雙射函數或程序來將數據歸一化到一定範圍,其均值接近0且方差接近於1.數據/特徵規範化

函數是雙射的,因爲我需要歸一化的特徵作爲具有雙曲線激活功能的中性網絡的輸入。我的過程將是在內存中轉換數據,將它們饋送到網絡並將網絡結果轉換回初始規模。

回答

2

這種規範化任務在神經網絡應用中非常常見。最常見的方法是簡單計算數據的平均值和標準偏差,並將這些值存儲在您的培訓計劃中。因此,管道爲您的數據則是:

  1. 計算mean和輸入數據的sd並將其存儲在內存中。
  2. 應用標準化轉換:normed_data = (data - mean)/sd
  3. 培訓/評估/使用網絡。
  4. 使用非規格化數據:original_data = (normed_data * sd) + mean

我寫了一篇關於數據標準化的較長文章。你可以閱讀它here

+0

謝謝你的回答。我剛剛意識到轉換函數Phi也可以應用於這種情況。之前,我只知道它用於轉換,標準化正態分佈式數據以使用正態分佈表。 –

+0

你在你的文章中說過,有必要計算均值和標準差。 Ys的偏差,輸出也是如此。你能解釋一下原因嗎? 讓我們考慮下面的例子: 樣本是特定區間(x0,x1)的隨機數集合S.輸入xi和目標yj總是S的子集。輸入由n到m-1的序列選擇,目標爲m。是否單獨計算平均值和標準差?偏差也適用於這種追逐? –