0
我有非常不平衡的數據,目標是分類。首先,我想檢查大多數類別的欠採樣。 1級有600,2級90,3級60和4級96樣本數據!使用權重處理不平衡數據
爲什麼使用重量,結果是不是更好嗎? 這是我的代碼:cfr = RandomForestClassifier(n_estimators=100,n_jobs=5,class_weight={1:1,2:30,3:30,4:30})
在我的代碼中是否有任何錯誤?你能指導我嗎?
我試着用重量。我正在使用sklearn的隨機森林,我不知道如何找到一個有效的權重數字。我用cfr = RandomForestClassifier(n_estimators = 100,n_jobs = 5,class_weight = {1:1,2:3,3:3,4:3}),但它沒有效果。我使用2,3和4組更高的數字,如10,20或甚至100.結果更糟糕。 – Talia
對不起,結果稍好一些 – Talia