他們是如何計算Caffe中這個convnet例子的輸出量的？

在此tutorial中，輸出量在輸出[25]中陳述，並且接受字段在輸出[26]中指定。他們是如何計算Caffe中這個convnet例子的輸出量的？

好的，輸入量[3, 227, 227]與區域大小爲[3, 11, 11]的區域進行了卷積。

使用這種formula(W−F+2P)/S+1，其中：
W =輸入音量大小
F =感受域大小
P =填充
S =步幅

...結果與(227 - 11)/4 + 1 = 55即[55 * 55 * 96]。到目前爲止這麼好:)

'pool1'他們用F=3和S=2我想？計算結果爲：55-3/2+1=27。

從這一點我有點困惑。第二個轉接層的接受字段爲[48, 5, 5]，但'conv2'的輸出等於[256, 27, 27]。這裏發生了什麼計算？

然後，'conv3'到'conv4'的輸出量的高度和寬度全部相同[13, 13]？這是怎麼回事？

謝謝！

如果在parameters of conv2 layer仔細觀察，你會發現

pad: 2

也就是說，輸入斑點是由2個額外的像素填充周圍的一切，因此公式現在是

27 + 2 + 2 - (5 - 1) = 27

填充內核大小爲5，而來自兩側的2像素產生相同的輸出大小。

2015-10-07 05:21:21 Shai

啊是的，謝謝，這個計算也是有效的：'（27 - 5 + 2 * 2）/ 1 + 1 = 27'。另外，還有一個問題。 'conv2'的深度是多少？深度是不是應該等於上一層應用的內核數量？再次，非常感謝您的時間。 –

@蘋果橙子我相信如此 – Shai

好了，我想我現在明白了。 –

回答