回答

1

大概你指的是Ronneberger等人發佈的U-Net架構的scientific paper。圖中顯示了這些數字。

U-Net architecture

的解釋是一個比特隱藏在工段中,紙的「3.培訓」:

由於未填充卷積,輸出圖像是小於輸入由不變的邊框寬度。

這意味着在每次卷積過程中,圖像的一部分被「裁剪」,因爲卷積將在座標中開始,從而與圖層的輸入圖像/輸入斑點完全重疊。在3x3卷積的情況下,這總是每邊一個像素。有關內核/卷積的更多視覺解釋,請參閱here輸出較小,因爲由於裁剪髮生在無墊圈卷積過程中(圖像的內部)部分會得到結果。

這不是該體系結構的一般特徵,而是(無襯墊)卷積所固有的東西,可以通過填充來避免。可能最常見的策略是在圖像邊界處進行鏡像,以便每個卷積可以從圖像的邊緣開始(並且在覈心重疊的地方看到鏡像像素)。然後輸入大小可以保留,完整的圖像將被分割。