2013-05-07 36 views
0

我想根據幾個變量來製作分類樹來預測1種鳥類的存在與否。我知道rpart處理單變量分區,mvpart處理多變量分區,但是我想使用mvpart作爲我的單變量樹,因爲它的輸出更加靈活。有誰知道我不應該這樣做的原因?分歧與mvpart在相同確切的輸入上會有所不同嗎?mvpart vs rpart中的分割規則

回答

2

不能保證分割是相同的; mvpart()正在最小化組內的平方和,而分類樹的rpart將最小化基尼係數(默認IIRC)。

您可能會得到相同的模型/分割,但由於這兩個函數使用兩種不同的節點雜質度量,這可能只是一種僥倖。

僅供參考,mvpart正在擬合迴歸模型,但您需要分類模型。

最後,考慮使用聚會包及其功能ctree;它比默認的rpart有更好的輸出,但同樣在模型擬合方面略有不同。另外,還可以查看plotmo包,其中包括對許多樹狀模型(包括IIRC,rpart)的增強圖。