我是想,當我運行我的代碼在tensorflow http://ufldl.stanford.edu/housenumbers/張流與卷積網絡
我在第一步權獲得成本楠創建卷積NN門牌號碼圖像上運行時給予楠損失。 這裏是鏈接到我已經把我的代碼GitHub的 https://github.com/ibnipun10/TensorFlow/blob/master/convhouseNumbers.ipynb
請讓我知道我會犯錯
我是想,當我運行我的代碼在tensorflow http://ufldl.stanford.edu/housenumbers/張流與卷積網絡
我在第一步權獲得成本楠創建卷積NN門牌號碼圖像上運行時給予楠損失。 這裏是鏈接到我已經把我的代碼GitHub的 https://github.com/ibnipun10/TensorFlow/blob/master/convhouseNumbers.ipynb
請讓我知道我會犯錯
的損失是NaN,因爲梯度是剛剛發生爆炸。
你的代碼看起來不錯,但你的學習率很高。嘗試使用較低的學習率(如1e-2
或1e-3
)並查看漸變是否仍然爆炸。
成癮,我不知道你在訓練中使用的圖像是否已被轉換爲浮點值並縮放以便具有零均值和單位標準,但通常這是處理有助於避免梯度爆炸的圖像。
Tensorflow有專門的功能:tf.image.per_image_whitening
兮兮代碼時,我看不出什麼錯,但我曾經得到NaN的在TensorFlow唯一的一次,我用了GradientDescent優化。你可以嘗試使用不同的優化器,如tf.train.AdamOptimizer? –