假設輸入是一個32x32的RGB圖像(所以32x32x3)。以後CNN中的過濾器如何識別顏色?
如果第一層conv網絡上的5x5x3過濾器識別出綠色淡入淡出,它將在28x28特徵映射中記錄激活值(給定1的步幅和0的填充)。
該功能地圖沒有關於顏色的信息,所以當它被輸入到下一個conv層時,conv2
,那麼conv2
將只會學習灰度過濾器。
那麼,像這樣的更高級別的過濾器如何包含顏色信息呢?
從this可視化,它好像他們甚至不與理會的顏色。另外,濾鏡中的顏色似乎變得如此扭曲,以至於他們沒有真正描述類功能的外觀。爲了澄清我在說什麼,請注意上圖中的第三組過濾器。在自然界,顏色不會以飽和的方式出現。我的直接反應是猜測它們看起來像是這樣,以使泛化更容易。但是,對於面部內側具有藍色調的狗的高等級過濾器是否會對標籤過程有害,因爲大多數狗在其面部特徵中不具有這種顏色?