該函數的輸出的大小的形式爲:當前正在廣泛使用上教程和其他地方的theano.tensor.nnet.conv.conv2d
conv_out = conv2d(
input= x, # some 4d tensor
filters= w, # some shared variable
filter_shape= [ nkerns, stack_size, filter_height, filter_width ],
image_shape= [ batch_size, stack_size, height, width ]
)
如果第一層美國有線電視新聞網,我有作爲
[ 20, 1 , 7, 7 ]
這是kernals的數量是20,每個7×7,'1'代表什麼?我的image_shape
是[100, 1, 84, 84 ]
。這個卷積現在輸出我理解的形狀
[ 100, 20, 26, 26]
的張量。我的下一層現在採用參數 =[50, 20, 5 ,5 ]
,image_shape
=[ 100, 20 ,26, 26 ]
併產生形狀爲[ 100 ,50 ,11 ,11 ]
的輸出。我似乎理解這種操作,除非如果我想使用生成的前20個功能地圖上的每個「50」過濾器層,我不應該生成1000個功能地圖,而不是隻生成50個功能地圖?爲了重申我的問題,我有一堆20個特徵映射,每個特徵映射都運行50個卷積,不應該是我的輸出形狀是[100, 1000, 11, 11]
而不是[ 100, 50 , 11, 11]
?
實際上,你能解釋一下如何得到[100,20,26,26]的輸出張量嗎?這正是我正在努力的。我認爲卷積是一個7x7形狀的濾波器,可以跨越輸入圖像,我認爲輸出張量是100 x 1 x 84-7 x 84-7 ...您的指針非常感謝! – Bastiaan