我有一個二元分類問題。我試圖訓練一個神經網絡來識別圖像中的物體。目前,我有大約1500張50x50的圖片。 問題是,通過水平翻轉的相同圖像來擴展我當前的訓練集是否是個好主意? (圖片不是對稱的)使用翻轉圖像進行機器學習數據集
感謝
我有一個二元分類問題。我試圖訓練一個神經網絡來識別圖像中的物體。目前,我有大約1500張50x50的圖片。 問題是,通過水平翻轉的相同圖像來擴展我當前的訓練集是否是個好主意? (圖片不是對稱的)使用翻轉圖像進行機器學習數據集
感謝
我認爲你可以做到這一點,以更大的程度上,不只是水平翻轉圖像,但1度改變圖像的角度。這將爲您在訓練集中的每個實例產生360個樣本。根據算法的速度,這可能是確保算法不僅能夠識別圖像及其鏡像的一種非常好的方法。
這可能是一個好主意,但是再次,我不知道圖像識別的目標或領域是什麼。假設圖像包含字符,並且您要求圖像識別軟件確定圖像是否包含正斜槓/
或反斜槓\
然後翻轉圖像會使您的訓練數據無效。如果你的域名不存在這樣的問題,那麼我認爲這是一個好主意,可以翻轉它們,甚至可以不同程度地旋轉。
我在AdaBoost中使用翻轉圖像,在課程中取得了巨大成功:http://www.csc.kth.se/utbildning/kth/kurser/DD2427/bik12/Schedule.php 從zip「TrainingImages.tar.gz」。
我知道在幻燈片的某處(在主頁上)使用翻轉圖像的優點/缺點有一些信息,但我無法找到它。還有一個很好的資源是http://www.csc.kth.se/utbildning/kth/kurser/DD2427/bik12/DownloadMaterial/FaceLab/Manual.pdf(和幻燈片一起)通過諸如尋找不同尺度和方向的東西。
如果圖像補丁不對稱我不認爲它是一個好主意翻轉。更好的想法是對訓練集進行一些相似變換,但有一些限制。增加數據集的另一種方法是向其中添加高斯平滑模板。確保正面和負面樣本的數量成正比。太多的積極和太少的消極可能會歪曲分類器並給測試集帶來不好的表現。
這取決於你的NN基於什麼。如果您要提取不依賴於圖像內空間位置的旋轉不變特徵或特徵(如直方圖或其他)並用這些特徵訓練NN,則旋轉不是一個好主意。
如果您直接在像素值上進行訓練,那麼這可能是一個好主意。 一些更多的細節可能會有用。