我知道圖像分類問題中的不平衡性,例如貓和狗的分類,如果貓的圖像太多而狗的圖像太少。但我不知道如何解決分割問題中的不平衡問題。例如,我的任務是掩蓋衛星圖像的雲層覆蓋,所以我將這個問題轉換爲兩類分割,一個是雲,另一個是背景。該數據集有5800個4-band-16bits圖像,大小爲256 * 256。該體系結構是Segnet,損失函數是二元交叉熵。什麼是圖像分割不平衡?
有兩種情況假設:
- 所有樣品中有一半是由雲層完全覆蓋,有一半是沒有任何的雲。
- 在每個圖像中,一半覆蓋雲,一半不覆蓋。
因此,案例2是平衡我猜,但情況1呢?
在實際和我的任務中,這兩種情況在源衛星圖像中是不可能的,因爲雲層對於背景總是相對較小,但是如果圖像樣本是由於其大尺寸而從源圖像中裁剪的,出現。
所以,樣品總是包含三種類型的圖像:
- 通過雲(254 5800個樣本)完全覆蓋。
- 沒有任何雲(1240在5800個樣本中)。
- 一些地區覆蓋雲,有些地區沒有。 (4305 5800,但我不知道雲計算的百分比,也許在一些樣品中非常高,也許有點其它樣品中)
我的問題:
是樣品不平衡和我應該怎麼辦?
在此先感謝。
感謝您的更正和回覆。我會嘗試caffe中的「InfogainLoss」圖層。 – spider
誰知道如何像caffe一樣在keras中輸出每班準確度? – spider