當前有哪些問題我遇到的是分類結果是不好即使我使用了許多不平衡的加工技術,如resampling
,smote
,cost-learning
。如果不平衡的處理方法都不起作用
具體來說,我有一個數據集,困難和容易是2班在我的數據集。雖然課堂分發服務不平衡(困難:簡單= 187:13)在我的數據集。
我使用random forest
來訓練我的模型並使用10-fold cross validation
對其進行評估,結果是在線「無策略」。
然後我用一些技術來處理這個不平衡的問題,但我只能得到非常低的實驗結果如下(「成本敏感」,「打擊」,「重採樣」),有些值甚至低於0.1。
Methods P(d) R(d) F(d) P(e) R(e) F(e) Acc
-------------------------------------------------------------
no strategy 0.000 0.000 0.000 0.935 0.995 0.964 0.930
cost-sensitive 0.500 0.077 0.133 0.939 0.995 0.966 0.935
smote 0.500 0.077 0.133 0.939 0.995 0.966 0.935
resampling 0.500 0.077 0.133 0.939 0.995 0.966 0.935
我該如何改進我的結果或是其他高級技術?在此先感謝:)
似乎'採樣','成本敏感的學習'不適合我,我不想用'異常檢測'來發現異常值:( – Yongfeng
P,R和F以上的平均精度,召回率和F-measure分別爲 – Yongfeng