我想在我的卷積神經網絡中實現批量標準化(http://arxiv.org/pdf/1502.03167.pdf),但我真的很困惑,因爲我應該計算平均值和方差。批量標準化:軸上的平均值和方差
如果到conv-layer的輸入形狀爲3 * 224 * 224 * 32
其中:
3-輸入通道。
224 * 224-形狀單通道的
32 minibatch大小
應該是軸什麼下述式
平均數= numpy.mean(input_layer,軸=?)
而,如果輸入到完全連接的層是形狀的100 * 32
其中:
100-輸入數
32- minibatch大小
再次,什麼應該是以下公式中的軸
Mean = numpy.mean(input_layer,axis =? )
嗨dontloo,感謝您的回覆。但在第3.2節(Batach標準化Convolutoinal Networks)的BN論文中提到:「我們使用有效的最小批量大小m'= | B | = m·pq」,其中pxq是特徵映射的大小。那麼它是不是意味着卷積層和完全連通層的軸應該不同? – Amrit
@Amrit是的,你是對的,非常抱歉我的無稽之談。我會稍微更新一些並鏈接一些代碼以供參考。 – dontloo
謝謝,這對我來說似乎是正確的。只要提一下:我想我們也可以使用「numpy.mean(input_layer,axis =(1,2,3))」作爲conv層,它更加緊湊。 – Amrit