2

在此tutorial中,輸出量在輸出[25]中陳述,並且接受字段在輸出[26]中指定。他們是如何計算Caffe中這個convnet例子的輸出量的?

好的,輸入量[3, 227, 227]與區域大小爲[3, 11, 11]的區域進行了卷積。

使用這種formula(W−F+2P)/S+1,其中:
W =輸入音量大小
F =感受域大小
P =填充
S =步幅

...結果與(227 - 11)/4 + 1 = 55[55 * 55 * 96]。到目前爲止這麼好:)

'pool1'他們用F=3S=2我想?計算結果爲:55-3/2+1=27

從這一點我有點困惑。第二個轉接層的接受字段爲[48, 5, 5],但'conv2'的輸出等於[256, 27, 27]。這裏發生了什麼計算?

然後,'conv3'到'conv4'的輸出量的高度和寬度全部相同[13, 13]?這是怎麼回事?

謝謝!

回答

3

如果在parameters of conv2 layer仔細觀察,你會發現

pad: 2 

也就是說,輸入斑點是由2個額外的像素填充周圍的一切,因此公式現在是

27 + 2 + 2 - (5 - 1) = 27 

填充內核大小爲5,而來自兩側的2像素產生相同的輸出大小。

+0

啊是的,謝謝,這個計算也是有效的:'(27 - 5 + 2 * 2)/ 1 + 1 = 27'。另外,還有一個問題。 'conv2'的深度是多少?深度是不是應該等於上一層應用的內核數量?再次,非常感謝您的時間。 –

+0

@蘋果橙子我相信如此 – Shai

+0

好了,我想我現在明白了。 –

相關問題