我有兩個數據集,看起來像這樣:深度學習的不平衡數據集
DATASET 1
Training (Class 0: 8982, Class 1: 380)
Testing (Class 0: 574, Class 1: 12)
DATASET 2
Training (Class 0: 8982, Class 1: 380)
Testing (Class 0: 574, Class 1: 8)
我試圖建立Tensorflow了深刻的前饋神經網絡。我在90年代獲得了精確度,在80年代獲得了AUC分數。當然,數據集嚴重不平衡,所以這些指標是無用的。我的重點是獲得良好的召回價值,我不想過分抽取1類。我已經玩弄了模型的複雜性無濟於事,最好的模型只能正確預測正面類的25%。
我的問題是,考慮到這些數據集的分佈,在沒有獲取更多數據(我無法獲得更多數據)的情況下構建模型是徒勞無益的,或者存在解決這個問題的數據的方法很不平衡。
謝謝!
不要回答重複,將它們作爲重複項關閉 –
是的 - 儘管如此,在我看來,問題更廣泛,即使我指向相同的解決方案。 – user1735003