2016-08-16 66 views

回答

1

因爲方形圖像很悅目。但是當域需要它時,在非方形圖像上有應用。例如,SVHN原始數據集是幾個數字的圖像,因此矩形圖像被用作跳轉的輸入,因爲here

1

沒有必要具有平方圖像。我看到它兩個「原因」:

  • 縮放:如果圖像被自動地從另一長寬比(和橫向/縱向模式)這在平均可能引入誤差最小縮放
  • 出版物/可視化:方形圖像很容易就可以顯示一起
1

從蘇哈斯皮拉伊:

的問題是不與卷積的層,它是完全連接 網絡層,需要修復神經元數量。例如,對於 示例,採用小型3層網絡+ softmax層。如果前2層是卷積+最大池,假設尺寸是卷積前後相同的 ,並且池會減少dim/2,這通常就是這種情況。對於在第一層中具有4個濾波器並且在第二層中具有6個濾波器的3 * 32 * 32(C,W,H)的圖像,在第二層末端的卷積+最大彙集之後的輸出將是6 * 8 * 8 ,而對於具有3 * 64 * 64的圖像,在第二層輸出 的末尾將是6 * 16 * 16。在完全連接之前,我們將其作爲單個矢量(6 * 8 * 8 = 384個神經元)進行拉伸,並進行完全連接的操作。 因此,對於不同尺寸的圖像,您不能有不同尺寸的完全連接圖層。解決這個問題的一種方法是使用空間金字塔池,其中您強制最後一個卷積層的輸出爲 將其彙集到固定數量的箱(I.e神經元),從而完全連接的層具有相同數量的神經元。您還可以檢查完整的 卷積網絡,它可以採取非方形圖像。