2017-02-15 25 views
0

我有7類圖像,我需要分類。每個班級都有不同數量的樣本。用不同數量的數據爲每個類別分類圖像

  1. 75圖像
  2. 70圖像
  3. 98圖像
  4. 182個圖像
  5. 146圖像
  6. 197圖像
  7. 150圖像

我結束了除去所有圖像在所有課堂上可以下載70張圖片(50次培訓和20次確認)。使用Keras和generator和flow_from_directory方法,我可以對它們進行分類,但顯然我不會得到很好的準確性。我有一個計劃,可以在以後增加數據。

我的問題是,我可以使用flow_from_directory方法爲每個類使用不同數量的訓練數據嗎?這種方法有什麼潛在的缺點嗎?

例如:

  1. 55培訓 - 20驗證
  2. 50培訓 - 20驗證
  3. 78培訓 - 20驗證
  4. ......

由於

+0

我相信不同數量的樣本可以工作,但是您的模型會偏向更頻繁的班級。在這個比例你不應該是一個問題。 –

回答

0

你可以,但最好等於使每個類別中訓練樣本的數量變大,或者分類器可能傾向於將圖像分類到訓練樣本最多的類別。

說,也許你可以在課堂2(通過複製和粘貼)的培訓樣本加倍?

對於數據增強,您可以向您添加噪聲訓練樣本,比如添加高斯噪聲,裁剪和調整圖像大小等等。通過這樣做,模型將更加健壯。

相關問題