爲什麼可以使用較小的遮罩掩蓋圖像？

u-net的輸入圖像大小爲572 * 572，但輸出掩碼大小爲388 * 388。圖像如何被一個更小的遮罩遮蓋？爲什麼可以使用較小的遮罩掩蓋圖像？

2017-05-17 zhkai

大概你指的是Ronneberger等人發佈的U-Net架構的scientific paper。圖中顯示了這些數字。

的解釋是一個比特隱藏在工段中，紙的「3.培訓」：

由於未填充卷積，輸出圖像是小於輸入由不變的邊框寬度。

這意味着在每次卷積過程中，圖像的一部分被「裁剪」，因爲卷積將在座標中開始，從而與圖層的輸入圖像/輸入斑點完全重疊。在3x3卷積的情況下，這總是每邊一個像素。有關內核/卷積的更多視覺解釋，請參閱here。 輸出較小，因爲由於裁剪髮生在無墊圈卷積過程中（圖像的內部）部分會得到結果。

這不是該體系結構的一般特徵，而是（無襯墊）卷積所固有的東西，可以通過填充來避免。可能最常見的策略是在圖像邊界處進行鏡像，以便每個卷積可以從圖像的邊緣開始（並且在覈心重疊的地方看到鏡像像素）。然後輸入大小可以保留，完整的圖像將被分割。

來源

2017-12-05 12:58:30 Honeybear

爲什麼可以使用較小的遮罩掩蓋圖像？

回答

相關問題