2017-07-05 21 views
0

如何一個tensorflow圖像運算(如nn.conv2d)預期圖像信道被表示?什麼RGB格式不tensorflow圖像OPS期待?

  1. 3個值範圍的陣列從[0-255]
  2. 3個值的陣列範圍從[0-1]
  3. 3尺寸的一個熱數組的數組255
  4. 別的東西?

我想了解爲什麼我的學習速度很差,我猜這是因爲我的輸入格式錯誤。

回答

1

conv2d接受你在這裏提到的所有形式。它不關心輸入範圍應該是什麼,只要它是數據類型的範圍內。但是從神經網絡培訓的角度來看,非常重要的是投入要適當調整。不僅輸入的圖像,但即使在各個層級,我們希望投入到正確縮放。這爲什麼,因爲它提高了通過網絡實現梯度的更好的流動培訓喜歡batch-normalization技術是存在於幾乎所有最近使用的網絡。因此,將圖像縮放到[-1,+1]範圍(或零均值單位方差)很重要。