0
我想根據幾個變量來製作分類樹來預測1種鳥類的存在與否。我知道rpart處理單變量分區,mvpart處理多變量分區,但是我想使用mvpart作爲我的單變量樹,因爲它的輸出更加靈活。有誰知道我不應該這樣做的原因?分歧與mvpart在相同確切的輸入上會有所不同嗎?mvpart vs rpart中的分割規則
我想根據幾個變量來製作分類樹來預測1種鳥類的存在與否。我知道rpart處理單變量分區,mvpart處理多變量分區,但是我想使用mvpart作爲我的單變量樹,因爲它的輸出更加靈活。有誰知道我不應該這樣做的原因?分歧與mvpart在相同確切的輸入上會有所不同嗎?mvpart vs rpart中的分割規則
不能保證分割是相同的; mvpart()
正在最小化組內的平方和,而分類樹的rpart
將最小化基尼係數(默認IIRC)。
您可能會得到相同的模型/分割,但由於這兩個函數使用兩種不同的節點雜質度量,這可能只是一種僥倖。
僅供參考,mvpart
正在擬合迴歸模型,但您需要分類模型。
最後,考慮使用聚會包及其功能ctree
;它比默認的rpart
有更好的輸出,但同樣在模型擬合方面略有不同。另外,還可以查看plotmo包,其中包括對許多樹狀模型(包括IIRC,rpart
)的增強圖。