2017-04-22 51 views
1

我有一個圖像大小WxHx3需要分成21個類。使用CNN通過一些圖層後,我獲得了W/4 x H/4 x 512功能圖。我們將最後使用ConvolutionalDeconvolutional圖層將其與softmax圖層中的標籤進行比較。我有2個拓撲:哪種拓撲結構對於分割是正確的?

Softmax_loss         Softmax_loss 
    ^           ^
     |            | 
    deconv_layer         conv_layer 
    ^           ^
     |            | 
    conv_layer         deconv_layer 
    ^           ^
     |            | 
Intermediate_layers       Intermediate_layers 
    ^           ^
     |            | 
    Input           Input 

     (1)           (2) 

哪種拓撲更好?我見過他們兩個。在FCN(完全卷積網絡進行語義分割)中的第1號,VoxResNetUNet中的第2號。

回答

3

深度學習沒有正確的方法。你通常會嘗試一些事情,哪些事情最適合你。如果你按照fcn模型,它開始像conv->deconv->conv->deconv。在語義分割中大多數被引用的論文做conv->deconv。所以我也會建議1號。也直觀地說,先做deconv沒什麼意義。

+0

是的。 FCN使用'conv(1x1,分類器) - > deconv'。然而,一些論文也使用'deconv-> conv(1x1)'像Unet,VoxResNet論文。所以我認爲他們有一些理由 – KimHee

+0

@KimHee你確定Unet,VoxResNet首先執行'deconv'嗎?我看到他們的prototxt文件,他們首先執行「conv」。如果你正在談論最後要做什麼,那麼我認爲最重要的是什麼是最重要的。 – lnman

+0

Unet是conv_u0d-sc是lass prototxt的分類器。 https://lmb.informatik.uni-freiburg.de/resources/opensource/3dUnet_miccai2016_no_BN.prototxt。我的意思是之前的softmax圖層過程 – KimHee