2017-06-01 37 views
0

這是我的第一個ANN項目,我想了解我是否正確處理數據規範化。在NN屬性中使用混合範圍是否正確?一些[0,1]和一些[-1,1]

,我有以下類型的屬性 *二進制 *數字(可以是陰性及陽性) *數值(即只能是正)

  1. 是不是正確的,一些屬性會在[-1,1]的範圍內擴散,有些在[0,1]的範圍內
  2. 有什麼方法可以將正數據轉換爲在[-1,1]範圍內擴展?
  3. 有意義的劑量?

回答

1
  1. 它不一定是「壞」的,只要你做到始終如一。但是,您必須查找神經網絡的哪些值 - 如果您的網絡採用[-1, 1]作爲輸入,則建議使用此範圍的所有值。是否有你想使用不同範圍的原因?

  2. 當然有! Check out this answer

  3. 神經網絡在歸一化之前不需要知道數字是正數還是負數。只要你一致地標準化每個輸入,那麼它就不會成爲問題。您的評論後


編輯:

你真的應該搞清楚,如果你的神經網絡庫接受擺在首位[-1, 1]

如果確實如此:

  • 保持距離範圍[0,1]
  • 保持正常(負)號的範圍內[-1,1]

如果它不:

  • 保持距離AND範圍內的所有其他值[0,1]

這就是我會這麼做的。但是,您可以通過反覆試驗來測試自己的最佳效果。

+0

一些數據(數字,正數和負數)表示位置,所以表示距離的增量可以是正數和負數。有些是字符串之間的編輯距離,所以只能是正值。爲此使用min/max函數是正確的嗎? –

+0

@AdiDarachi我明白你的意思了。我會編輯我的答案。 –

+0

1.我使用Tanh作爲激活函數,因此網絡可以接收[-1,1]範圍(使sens的劑量?)。 2.當-1最差,1最好時,最好保持範圍0-1而非-1:1。感謝先進 –