爲什麼卷積神經網絡的輸入總是平方的圖像？

我一直在使用CNN進行深度學習，我意識到模型的輸入始終是平方圖像。爲什麼卷積神經網絡的輸入總是平方的圖像？

我看到卷積運算或神經網絡架構本身都不需要這樣的屬性。

那麼，這是什麼原因呢？

感謝您的評論！

來源

2016-08-16 T Nguyen

因爲方形圖像很悅目。但是當域需要它時，在非方形圖像上有應用。例如，SVHN原始數據集是幾個數字的圖像，因此矩形圖像被用作跳轉的輸入，因爲here

來源

2016-08-16 14:52:53

沒有必要具有平方圖像。我看到它兩個「原因」：

縮放：如果圖像被自動地從另一長寬比（和橫向/縱向模式）這在平均可能引入誤差最小縮放
出版物/可視化：方形圖像很容易就可以顯示一起

來源

2016-08-24 10:24:17

從蘇哈斯皮拉伊：

的問題是不與卷積的層，它是完全連接網絡層，需要修復神經元數量。例如，對於示例，採用小型3層網絡+ softmax層。如果前2層是卷積+最大池，假設尺寸是卷積前後相同的，並且池會減少dim/2，這通常就是這種情況。對於在第一層中具有4個濾波器並且在第二層中具有6個濾波器的3 * 32 * 32（C，W，H）的圖像，在第二層末端的卷積+最大彙集之後的輸出將是6 * 8 * 8 ，而對於具有3 * 64 * 64的圖像，在第二層輸出的末尾將是6 * 16 * 16。在完全連接之前，我們將其作爲單個矢量（6 * 8 * 8 = 384個神經元）進行拉伸，並進行完全連接的操作。因此，對於不同尺寸的圖像，您不能有不同尺寸的完全連接圖層。解決這個問題的一種方法是使用空間金字塔池，其中您強制最後一個卷積層的輸出爲將其彙集到固定數量的箱（I.e神經元），從而完全連接的層具有相同數量的神經元。您還可以檢查完整的卷積網絡，它可以採取非方形圖像。

來源

2016-08-26 01:38:26

爲什麼卷積神經網絡的輸入總是平方的圖像？

回答

相關問題