2
在此tutorial中,輸出量在輸出[25]中陳述,並且接受字段在輸出[26]中指定。他們是如何計算Caffe中這個convnet例子的輸出量的?
好的,輸入量[3, 227, 227]
與區域大小爲[3, 11, 11]
的區域進行了卷積。
使用這種formula(W−F+2P)/S+1
,其中:
W
=輸入音量大小
F
=感受域大小
P
=填充
S
=步幅
...結果與(227 - 11)/4 + 1 = 55
即[55 * 55 * 96]。到目前爲止這麼好:)
'pool1'他們用F=3
和S=2
我想?計算結果爲:55-3/2+1=27
。
從這一點我有點困惑。第二個轉接層的接受字段爲[48, 5, 5]
,但'conv2'的輸出等於[256, 27, 27]
。這裏發生了什麼計算?
然後,'conv3'到'conv4'的輸出量的高度和寬度全部相同[13, 13]
?這是怎麼回事?
謝謝!
啊是的,謝謝,這個計算也是有效的:'(27 - 5 + 2 * 2)/ 1 + 1 = 27'。另外,還有一個問題。 'conv2'的深度是多少?深度是不是應該等於上一層應用的內核數量?再次,非常感謝您的時間。 –
@蘋果橙子我相信如此 – Shai
好了,我想我現在明白了。 –