我們如何使用'rpart'包來指定參數'minsplit ='來執行決策樹。如何在決策樹中使用rpart決定'minsplit'?
rpart包(myFormula,數據=火車,控制= rpart.control(minsplit = 10))
我們如何使用'rpart'包來指定參數'minsplit ='來執行決策樹。如何在決策樹中使用rpart決定'minsplit'?
rpart包(myFormula,數據=火車,控制= rpart.control(minsplit = 10))
minsplit: - 其必須存在於一個節點,以便分割要被嘗試的觀測值的最小數目。 (https://stat.ethz.ch/R-manual/R-devel/library/rpart/html/rpart.control.html)
您可以通過指定您自己的值來覆蓋minsplit控制參數。但請注意,這可能會導致過度擬合決策樹。例如,如果您的數據點不足以創建RPART默認參數集的樹,那麼你可以調整minsplit,minbucket的值來創建一棵樹。
您可以在查看數據集後決定數值。
RPART的默認值: - 。minsplit = 20,minbucket =圓形(minsplit/3)
樹< - rpart包(結果〜,方法= 「類」,數據=數據,控制= rpart.control( minsplit = 1,minbucket = 1,cp = 0))