2015-01-01 45 views
0

我想在著名的泰坦尼克號數據集運行中的R榆樹下面的例子:極端學習機屬性

library(elmNN) 
dataset <- read.csv(training_data) 
formula <- as.factor(Survived) ~ Sex + Age + Pclass + Fare + SibSp + Parch + Embarked 
elm_fit <- elmtrain(formula, dataset, nhid=10, actfun="sig") 
testset$PredSurvived <- predict(elm_fit, testset, type="class") 

的訓練方法拋出我下面的錯誤:

Error in ginv(t(H), tol = sqrt(.Machine$double.eps)) %*% t(T) : requires numeric/complex matrix/vector arguments 

據我所知,這是因爲算法期望數值數據,而我的屬性是離散的。

我的問題是有沒有辦法將這種算法應用於我的數據集?

+2

將所有列強制爲數字? –

+0

將不起作用,因爲算法內部乘以數字數據的矩陣。我想知道是否存在接受離散數據的算法的變體。 –

回答

1

使用model.matrix將因子轉換爲二進制表示。例如,可以將虹膜中的物種生成爲model.matrix(〜Species,data = iris)