2016-04-24 90 views
2

目標是從圖像本地化對象。我決定修改和培訓一個現有的模型。但是,我不能決定我是否應該使用口罩或僅通過ROI來訓練模型。爲卷積神經網絡選擇訓練圖像

例如:對於第1類數據,只有第1類對象可以在圖像上顯示,其他區域將填充0,對於第2類我會做同樣的事情,並且只會離開第二類是面具中的對象,第三和第四類也是如此。

第二種方式,使用投資回報率:我將裁剪圖像中的每個類,而不使用蒙版,僅對感興趣的區域進行裁剪。

然後,我希望能繼續做類似的事情,這一點:https://github.com/jazzsaxmafia/Weakly_detector

我要選擇的第一方式或第二?任何意見,如「你的計劃將無法正常工作,試試這個」,也表示讚賞。

- 編輯 - 需要明確的是,

原圖http://s31.postimg.org/btyn660bf/image.jpg

第1'的方式使用口罩:

P.S:對象的位置將是非常相似的新的例子,也許使用面膜的方法可以更有效一點。對於ROI方法,我需要規格化每個尺寸大小不同的物體。然而,將整個圖像掩模標準化可以保持原始圖像之間的差異更小。

回答

1

假設他們接受了大量高質量數據的訓練,CNN通常對各種背景都非常有效。所以我猜想,使用面具和ROI方法之間的差異不會很大。對於它的價值,無論您使用哪種方法,您都需要規範您提供給CNN的圖像的大小。

我已經實現了一些手勢識別軟件,並遇到類似的問題。我可以使用原始的,未處理的ROI,或者我可以使用預處理版本濾除大部分背景。我基本上都嘗試過這兩種方式,並比較了模型的準確性。就我而言,我能夠從預處理的圖像中獲得稍好的結果。另一方面,我的圖像中的背景更加複雜和多樣。無論如何,我的建議是建立一個可靠的機制來測試模型的準確性,然後進行實驗,以確定最佳效果。

老實說,最重要的是收集批次爲每個類的好樣品。就我而言,我一直看到實質性的改進,直到我每班上5000幅圖像。由於收集大量數據需要很長時間,因此最好捕獲並存儲原始的全尺寸圖像以及實際數據收集中涉及的任何元數據,以便您可以嘗試不同的方法(掩蔽與投資回報率,變化的輸入圖像大小,其他預處理如直方圖歸一化等)而不必收集新數據。