0
其他隨機森林工具具有限制特定分支上最大分割深度的「撥號」。例如,「R」套裝「遊俠」中的「最大深度」是什麼?
h2o.randomForest具有「max_depth」。
「ranger」的版本是什麼?
其他隨機森林工具具有限制特定分支上最大分割深度的「撥號」。例如,「R」套裝「遊俠」中的「最大深度」是什麼?
h2o.randomForest具有「max_depth」。
「ranger」的版本是什麼?
我對h2o.randomForest
軟件包並不熟悉,但是我對隨機森林的一般理解是,每棵樹都會生長,直到樹的每片葉子都有一定數量的最小數據點。換句話說,一棵樹會一直分裂,直到每個數據點的分類達到一定程度。在標準randomForest
包,有一個稱爲nodesize
參數控制該:
https://stats.stackexchange.com/questions/158583/what-does-node-size-refer-to-in-the-random-forest
在ranger
包中的類似的參數似乎是min.node.size
。您可以將上述鏈接中的信息與documentation進行比較,以說服自己他們都在討論相同的事情。
最大深度是關於樹樁和樹葉之間有多少分裂。這是一個用於避免過度擬合的控制參數。 – EngrStudent
@EngrStudent我不認爲過度裝修是隨機森林的一大問題。在任何情況下,節點大小都可以爲您提供相同的分割控制。 –
任何事情都可能過度適應。這不是最大的問題,但如果你想調整表演,那麼你必須調整。如果限制爲二叉樹所做的分割數量,那麼您將計算時間設爲上限。 – EngrStudent