2017-05-01 126 views
0

我目前正在嘗試使用衛星圖像來識別蘋果園。我在每個班級的代表性數據數量方面面臨一個小問題。Keras - 二進制分類

其實我的問題是:

是否有可能在每個時期採取隨機一些不同的圖像,在我的「非蘋果」類,因爲我有更多的論文(與「蘋果」一),我想增加我的網絡將分類出一個不具代表性的圖像的概率。

在此先感謝您的幫助

回答

0

那是不可能的Keras。 Keras默認會將您的訓練數據進行混洗,然後以小批量方式進行訓練。但是,仍然有辦法重新平衡數據集。

您面臨的不平衡的培訓數據問題很常見。你有很多選擇可供你選擇;我在下面列出幾個:

  1. 可以使用model.fit()功能class_weight關鍵字調整類的相對權重。
  2. 您可以「上樣」您的「蘋果」類或「下樣」您的「非蘋果」類,以在訓練期間擁有相同數量的兩個類。
  3. 您可以生成「蘋果」類的合成圖像以增強數據集。爲此,Keras中的ImageDataGenerator類可能特別有用。這個​​是一個很好的介紹它的用法。

以我的經驗,我發現#2和#3是最有用的。當使用相差幾個數量級和較小批量的類別權重時,隨機梯度下降的收斂受到影響,因此#1受到限制。

Jason Brownlee將a list of tactics for dealing with imbalanced classes放在一起,這可能對您也有用。

+0

謝謝!然後,我將增加我的蘋果數據集,看起來好計劃:) –