2017-10-20 84 views
1

我正在嘗試構建cnn模型(keras),它可以根據用戶的情緒對圖像進行分類。我遇到數據問題。我有非常小的訓練數據。增加數據會有幫助嗎?它是否提高了準確性?在這種情況下,應該選擇增加數據,並應該避免?圖像增強是否有幫助?

回答

2

將增加數據幫助嗎?它是否提高了準確性?

這很難預先說明。但幾乎可以肯定的是,當你已經有一個比隨機更好的模型。當你選擇正確的增強方法。

查看我的碩士論文Analysis and Optimization of Convolutional Neural Network Architectures,第80頁瞭解許多不同的增強方法。

在這種情況下,應選擇增加數據,並應避免?

  • 當你沒有足夠的數據 - >增強
  • 避免擴充,你不能告訴隆胸後的情感。因此,在字符識別的情況下,輪換是一個壞主意(例如由於6 vs 9u vs n\rightarrow vs \nearrow
+0

謝謝,我會參考。 – Afrid

2

是的,數據增加真的有幫助,有時它確實是必要的。 (但看看馬丁托馬的答案,那裏有更多的細節和一些重要的「關心」)。

時,您應該使用它:

  • 你有太少的數據
  • 您發現您的模型過學習太容易(可以是一個模型太強大太)

過擬合是什麼當你的模型能夠記住數據時會發生這種情況。然後它對訓練數據的準確度非常高,但對測試數據的準確性很差。

增加訓練數據的大小會使模型難以記憶。這裏和那裏的小變化會讓你的模型停止關注那些沒有任何意義的細節(但能夠創造圖像之間的區別)並開始注意確實會產生所需效果的細節。

+0

做縮放,縮放和旋轉就足夠了增強,或者我們也可以玩的渠道和直方圖均衡? – Afrid

+1

如果不嘗試一些增強就足夠了,你不能說。更有趣的問題是如果他們改進模型。而且這也是非常問題,模型和數據集具體(+1爲答案) –

+0

的確,@MartinThoma。 –