2017-05-31 61 views

回答

0

我對h2o.randomForest軟件包並不熟悉,但是我對隨機森林的一般理解是,每棵樹都會生長,直到樹的每片葉子都有一定數量的最小數據點。換句話說,一棵樹會一直分裂,直到每個數據點的分類達到一定程度。在標準randomForest包,有一個稱爲nodesize參數控制該:

https://stats.stackexchange.com/questions/158583/what-does-node-size-refer-to-in-the-random-forest

ranger包中的類似的參數似乎是min.node.size。您可以將上述鏈接中的信息與documentation進行比較,以說服自己他們都在討論相同的事情。

+0

最大深度是關於樹樁和樹葉之間有多少分裂。這是一個用於避免過度擬合的控制參數。 – EngrStudent

+0

@EngrStudent我不認爲過度裝修是隨機森林的一大問題。在任何情況下,節點大小都可以爲您提供相同的分割控制。 –

+0

任何事情都可能過度適應。這不是最大的問題,但如果你想調整表演,那麼你必須調整。如果限制爲二叉樹所做的分割數量,那麼您將計算時間設爲上限。 – EngrStudent