問題完全連接層在卷積神經網絡的數學細節。假定該網的結構(目標其中是圖像分類)是這樣尺寸的輸入,以從卷積層中的CNN
- 輸入圖像的32×32
- 第一隱藏層3x28x28(通過與 大小5x5的,步幅長度的3個濾波器進行卷積而形成= 0和沒有填充),其次是 活化
- 池層(彙集在2×2的區域)產生 3x14x14
- 第二隱藏層6x10x10的輸出(通過用6個過濾器尺寸5×5的 ,步幅長度= 0卷積形成並沒有填充) ,隨後 活化
- 池層(超過2×2區域彙集)產生 6x5x5
- 完全連接層(FCN)-1的輸出與100層的神經元
- 完全連接層(FCN)-2用10神經元
從我到目前爲止的讀數中,我瞭解到每個6x5x5矩陣都連接到FCN-1。我有兩個問題,這兩個問題都與從一層輸出到另一層的方式有關。
- 第二個池化層的輸出是6x5x5。這些如何饋送到FCN-1?我的意思是FCN-1中的每個神經元都可以看作是一個標量作爲輸入(或1x1矩陣)的節點。那麼我們如何爲它提供6x5x5的輸入?我最初認爲我們會將6x5x5矩陣變平並將其轉換爲150x1陣列,然後將其饋送到神經元,就好像我們有150個訓練點。但是,功能地圖並沒有打破圖像空間結構的論點?
- 從第一個池中我們得到3個大小爲14x14的特徵地圖。第二層中的特徵映射如何生成?假設我從第一個卷積圖層得到的3個特徵映射看同一區域(從特徵映射左上角開始的5x5區域)。這三個5x5補丁是否被用作單獨的訓練樣例來在下一組特徵映射中生成相應的區域?如果是這樣,那麼如果三個特徵映射是輸入圖像的RGB值,那該怎麼辦?我們仍將它們作爲單獨的訓練實例嗎?
請使用換行符和段落以及粗體,斜體,代碼特徵以使答案更清晰 – Subaz