2017-10-21 107 views
0

我有以下代碼:快速R-CNN和問題spatialScale在BrainScript

model (features, rois) = { 

     convOut = convLayers (features) 
     roiOut = ROIPooling (convOut, rois, (9:9),spatialScale=64.0/196.0) 
     z = fcLayers (roiOut) 


    }.z 

原文摘自:cntk \例子\圖片\檢測\ FastRCNN \ BrainScript

什麼是spatialScale在ROIPooling我該如何計算它?

如果在cntk.exe的輸出中找到了它。

正在驗證 - > z.convOut.z.rn3.rr = RectifiedLinear(z.convOut.z.rn3.rr_):[49 x 49 x 64 x *] - > [49 x 49 x 64 x *]

驗證 - >的ROI = inputValue的(): - > [4×1000×*]

驗證 - > z.roiOut = ROIPooling(z.convOut.z.rn3.rr,感興趣區):[49 x 49 x 64 x *],[4 x 1000 x *] - > [9 x 9 x 64 x 1000 x *]

回答

1

空間尺度是輸入的空間分辨率與ROI和輸入圖像到網絡的空間分辨率。 1/16.0是原始快速和更快的R-CNN實現中使用的值,該值取決於網絡。

相當多,空間尺度是ROI相對於原始圖像輸入的比例尺。

感謝,
伊馬德

+0

所以我的例子中,我都設有64×64的ROI和196x196一個輸入圖像。這將給出一個spatialScale = 64/196 = 0.32 –

+0

你的ROI節點的輸入分辨率是多少,而不是ROI的大小。 –

+0

好的,如果我正確理解你,你要求輸入分辨率給roiOut。我已經添加了我認爲是問題的解決方案。 –