我想用randomForest做分類,但我反覆得到一個似乎沒有明顯解決方案的錯誤消息(randomForest在過去對我進行迴歸工作的很好)。下面粘貼了我的代碼。 '成功'是一個因素,所有因變量都是數字。有關如何正確運行此分類的任何建議?R randomWorest分類
> rf_model<-randomForest(success~.,data=data.train,xtest=data.test[,2:9],ytest=data.test[,1],importance=TRUE,proximity=TRUE)
Error in randomForest.default(m, y, ...) :
NA/NaN/Inf in foreign function call (arg 1)
也,這裏是該數據集的樣本:
head(data)
success duration goal reward_count updates_count comments_count backers_count min_reward_level max_reward_level
True 20.00000 1500 10 14 2 68 1 1000
True 30.00000 3000 10 4 3 48 5 1000
True 24.40323 14000 23 6 10 540 5 1250
True 31.95833 30000 9 17 7 173 1 10000
True 28.13211 4000 10 23 97 2936 10 550
True 30.00000 6000 16 16 130 2043 25 500
沒有一個完全可重複的例子,沒有。至少,我會(1)檢查數據中是否沒有NA值,並且(2)運行'traceback()'以查看是否可以獲得有關錯誤發生位置的更詳細信息。 – joran
嘗試將「成功」值更改爲物種名稱而不是「真」。你能告訴我們srt(數據)的輸出嗎? –
看來你已經接受了一個答案;我遇到了這個問題,發現對於分類來說,這是因爲我的響應變量是'chr'類。要麼執行'data $ var < - as.factor(data $ var)',要麼使用'randomForest(as.factor(data $ var)〜。,...)'預測'爲我解決了這個問題。 – Hendy