隨機森林是一個強大的算法。在隨機森林中,它訓練幾棵小樹並且具有OOB精度。但是,是否有必要同時使用隨機森林進行交叉驗證?是否需要同時運行交叉驗證的隨機森林
2
A
回答
4
OOB錯誤是隨機森林誤差的無偏估計,所以這很好。但是你使用交叉驗證的是什麼?如果您將RF與其他未使用套袋的算法進行比較,則需要使用較低的方差來比較它們。無論如何,您必須使用交叉驗證來支持其他算法。然後使用交叉驗證樣本分割RF,而其他算法仍然是一個好主意,這樣可以消除分割選擇造成的變化。
如果您將一個RF與另一個RF與不同的功能集進行比較,那麼比較OOB錯誤是合理的。如果您確保兩個RF在訓練期間使用相同的套袋套件,則尤其如此。
4
您不需要需要來執行任何類型的驗證。如果你只是想使用它,並不在乎過度配合的風險。
對於科學出版物(或其他任何地方,你的比較不同分類器的質量),你應該驗證你的結果,交叉驗證是一個最佳實踐。
相關問題
- 1. 如何在R中執行隨機森林/交叉驗證
- 2. Spark隨機森林交叉驗證錯誤
- 3. 計算隨機森林與休假一個ID交叉驗證
- 4. 隨機森林優化與調整和交叉驗證
- 5. 留出一個ID交叉驗證的隨機均勻森林中的R
- 6. ROC隨機森林
- 7. python中的隨機森林
- 8. 隨機森林中的R
- 9. R-隨機森林 - 重要性/ varImPlot
- 10. 隨機森林sklearn變量重要性
- 11. 構建一個隨機森林迴歸器,從頭開始進行交叉驗證
- 12. 在WEKA中運行交叉驗證之前是否需要應用過濾器
- 13. 隨機森林是AdaBoost的特例嗎?
- 14. 隨機森林可變長度不同
- 15. 隨機森林:網格搜索運行時錯誤
- 16. Spark隨機森林錯誤
- 17. 隨機森林,使用R
- 18. P值爲隨機森林
- 19. 隨機森林分析
- 20. 隨機森林分類器
- 21. OpenCV - 隨機森林示例
- 22. R隨機森林:data(x)有0行
- 23. Keras回調時運行交叉驗證
- 24. 「決策森林」和「隨機森林」的簡潔區分
- 25. 如何實現交叉驗證和隨機森林分類定功能集作爲字典?
- 26. 如何從h2o隨機森林對象中獲取隨機森林閾值
- 27. 我是否需要將名義變量轉換爲sklearn隨機森林的不同字段?
- 28. 多類決策森林vs隨機森林
- 29. R:結合森林時隨機森林的錯誤使用插入符號
- 30. 預測隨機森林包函數給出了隨機森林不同的結果與XTEST和