2013-06-27 24 views
2

我試圖用rpart對具有16個變量和420個觀測值的數據集進行分類(數據集是http://archive.ics.uci.edu/ml/datasets/Arrhythmia數據集的一個子集;我只選擇了某些變量並排除了缺失的觀測值)。rpart - 無限循環

我跑的代碼如下,問題是,它似乎被卡在一個無限循環:

library(rpart) 
newdata_frame <- data.frame(newdata) 
tree <- rpart(class~ ., data=newdata_frame, method="class") 

我是很新的軟件rpart,所以我沒有很多的想法關於如何嘗試解決這個問題。我試着在相同的數據集上運行「樹」,它表現良好。

關於爲什麼rpart可能陷入無限循環的任何想法? 感謝您的幫助!不勝感激! L.

+0

哪些變量明確存在於分析數據集中? –

+0

爲什麼你覺得它陷入了無限循環? – Dason

回答

0

這個問題可能與這樣一個事實有關,即某些類的觀測值很少(有些觀測值爲0,但忽略)。既然你說樹運行良好,我假設緩慢在rpart算法的修剪階段。這是樹已經構建的階段,但rpart算法通過刪除一些分區(分支)決定減少過度擬合。

快速修復可能是預測受試者是否患有任何形式的心律失常(即1級vs其他)。