2

我使用Deep學習朱古力框架圖像分類。
我有面孔的硬幣。他們中的一些人被留下來,其中一些人是對的。卷積ImageNet網絡是不變的翻轉圖像

要進行歸類,我使用常見的形式給出 - 採取從預訓練ImageNet網絡的權重和結構已經俘獲了不少的圖像模式和訓練大多是最後一層,以適應我的訓練集。

但我發現netowork不適用於這個集合: 我已經拿了一些硬幣,例如leftdirected,生成水平翻轉的圖像,並將其標記爲右側。

right sided face

對於這組卷積淨得約50%的準確率,正是隨機結果。

我也曾嘗試訓練2幅圖像(2翻轉「H」字母的版本)網。但是同樣的結果 - 50%。 (如果我選擇不同的字母和訓練數據集 - 我非常快速地收到100%的準確性)。但不變翻轉我的分類。

enter image description here enter image description here

我的問題是:是存在一定的形式給出了該allowes我使用預訓練imagenet的優勢,但不知何故破這個不變性。網上什麼層可以使不變。

我使用「朱古力」基於這個例子的做法產生淨:訓練有素的圖像淨

https://github.com/BVLC/caffe/blob/master/examples/02-fine-tuning.ipynb

+0

請問您的數據集具有相同的硬幣或多個硬幣的圖像? – malreddysid

+0

@malreddysid:不同的硬幣。 – Oleg

回答

3

來自Caffe基本/基準車型大多使用非常瑣碎的圖像增強:水平翻轉圖像。也就是說,imagenet類在水平翻轉時確實是相同的。因此,您要微調的重量在水平翻轉,應該被忽略的設置進行了培訓,我想你看到的是,拍攝到這張相當不錯的淨 - 它不再是這個特殊的轉型敏感。
這是不平凡的告訴這個不變性發生淨的哪一層,因此它是不容易說什麼層應該是微調,以克服這種行爲。我認爲這種不變性對網絡來說是非常重要的,如果需要對整個網絡進行重新培訓,我不會感到意外。