如果我在lrge訓練集上訓練支持向量機,並且如果類變量爲True或False,與訓練集中False值的數量相比,True值是否會影響訓練模型/結果?他們應該是平等的嗎?如果我的訓練集不具有True和False的平等分佈,我該如何照顧這一點,以便儘可能有效地完成我的訓練?如何處理SVM中的數據不平衡?
6
A
回答
3
數據不平衡是很好的,因爲SVM應該能夠對與不太可能的實例相關的錯誤分類錯誤(例如您的案例中的「真」)分配更大的懲罰,而不是分配相同的錯誤權重,這會導致不合要求的分類器將所有內容分配給大多數人。但是,你會可能獲得更好的結果與平衡的數據。這一切都取決於你的數據,真的。
您可以人爲地歪曲數據以獲得更平衡的數據。你爲什麼不檢查這篇文章:http://pages.stern.nyu.edu/~fprovost/Papers/skew.PDF。
2
我的經驗是,標準的SVM分類器不能很好地處理不平衡的數據。我遇到了C-SVM,它對於nu-SVM更糟糕。也許你想看看P-SVM,它提供了一種特別適用於不平衡數據的模式。
相關問題
- 1. OpenCV中的SVM:如何處理不平衡數據?
- 2. 如何處理高度不平衡的數據集
- 3. 如何處理多標籤分類中的不平衡數據集
- 4. WCF + SSL如何處理負載平衡?
- 5. Xgboost處理不平衡的分類數據
- 6. 如何處理這種不平衡類別的傾斜數據集?
- 7. 長格式數據處理與不平衡觀測
- 8. 使用權重處理不平衡數據
- 9. 不平衡括號(批處理文件)
- 10. ASP.Net - 在負載平衡環境中處理會話數據?
- 11. 如何處理reduce任務的不平衡輸入?
- 12. 如何在R中創建平衡訓練和不平衡測試數據集?
- 13. 不平衡分類數據
- 14. Sparkline數據幀不平衡
- 15. R優雅的平衡不平衡面板數據的方法
- 16. 如果不平衡的處理方法都不起作用
- 17. 如何處理負載平衡中的返回會話
- 18. 如何處理Solr中的負載平衡?
- 19. 如何用sklearn GroupKfold處理類別不平衡?
- 20. 收據不平衡
- 21. 並行處理的負載平衡
- 22. for cat平衡數據處理貓提高
- 23. 批處理標準化是否適用於平衡數據集?
- 24. 如何分類weka中的不平衡數據?
- 25. 不平衡數據的設計矩陣
- 26. Python多處理負載平衡器
- 27. 如何平衡numpy數組中的類?
- 28. 如何計算R中不平衡面板數據的逐年平均值?
- 29. 平衡如何平衡B-樹
- 30. 如何將R中不平衡面板數據的數據調整超過99%?