所以我想爲我的數據集擬合隨機森林分類器。我對R很新,我想這是一個簡單的格式問題。運行randomForest時出錯:未找到對象
我在一個文本文件中讀取和轉換我的數據集因此它是這種格式:(取出信息保密)
>head(df.train,2)
GOLGA8A ITPR3 GPR174 SNORA63 GIMAP8 LEF1 PDE4B LOC100507043 TGFB1I1 SPINT1
Sample1 3.726046 3.4013711 3.794364 4.265287 -1.514573 7.725775 2.162616 -1.514573 -1.5145732 -1.514573
Sample2 4.262779 0.9261892 4.744096 7.276971 -1.514573 4.694769 4.707387 2.031476 -0.8325444 2.615991
...
...
CD8B FECH PYCR1 MGC12916 KCNA3 resp
Sample1 -1.514573 2.099336 3.427928 1.542951 -1.514573 1
Sample2 -1.145806 1.204241 2.846832 1.523808 1.616791 1
本質列是我的特點,行我的樣本,最後一列是我的反應向量,它是一列因子,
然後我用:
set.seed(1) #Set the seed in order to gain reproducibility
RF1 = randomForest(resp~., data=df.train,ntree=1000,importance=T,mtry=3)
只是想使用其他列的功能訓練對我的專欄resp
的RF。
但我得到的錯誤:
Error in eval(expr, envir, enclos) : object 'PCNA-AS1' not found
然而,尋找到我的訓練集,我可以清楚地發現,塔,例如有:
sort(unique(colnames(df.train))
所以,我真的不理解的錯誤或從哪裏去。如果我沒有以正確的方式提出問題,我表示歉意,感謝任何幫助!
你可以讓這個可重複的例子(又名提供'df.train'導致錯誤的示例數據)? – josliber