我原來有一個數據框由N行12列組成。最後一列是我的班級(0或1)。我有我的整個數據幀轉換爲數值與使用randomforest()在R中進行分類?
training <- sapply(training.temp,as.numeric)
不過轉念一想,我需要的類列是一個因素列使用隨機森林()工具的分類,所以我也
training[,"Class"] <- factor(training[,ncol(training)])
我繼續與
training_rf <- randomForest(Class ~., data = trainData, importance = TRUE, do.trace = 100)
創建樹但我發現了兩個錯誤:
1: In Ops.factor(training[, "Status"], factor(training[, ncol(training)])) :
<= this is not relevant for factors (roughly translated)
2: In randomForest.default(m, y, ...) :
The response has five or fewer unique values. Are you sure you want to do regression?
如果有人能指出我所做的格式錯誤,我將不勝感激。
謝謝!
您正在嘗試使用'<='作爲賦值而不是'<-'。你還在創建一個新的專欄?如果是這樣的話,你應該刪除'Class'的數字版本或者不要在你的公式中使用'.' –
解決這個問題的唯一信息就是'str(訓練)'的輸出。 – joran
@joran:num [1:891,1:12] 1 2 3 4 5 6 7 8 9 10 ... - attr(*,「dimnames」)= 2列表中的2 .. $:NULL .. $:chr [1:12]「ID」「Class」「Sex」「Age」... – marc