2015-02-12 89 views
1

在R-包「插入符」的數據集MDRR包含具有預測一個數據幀和一矢量因子mdrrClass創建預測的數據幀和一個因子矢量

require(caret) 
data(mdrr) 

如何創建一個類似的格式爲我自己的數據集,其中PRED1,PRED2,Pred3在數據幀,而相應的「類」的因素?說

x = data.frame(id = c("a","c","d","g"), 
      Pred1 = c(1,3,4,7), Pred2 = c(1,3,4,7), 
      Pred3 = c(1,3,4,7), 
      class = c(1,3,4,7)) 

謝謝。

+0

現在就是你們的榜樣不同於你想要的?我很困惑你的問題在這裏。 – MrFlick 2015-02-12 04:07:05

+0

@MrFlick 對不起,我感到困惑。 如何爲我自己的數據集創建一個類似的格式,其中Pred1,Pred2,Pred3在數據框中,而相應的'class'作爲因子? – ayol 2015-02-12 05:23:36

+0

只是不要把「class」放入data.frame中,然後放入'myclass <-factor(c(1,3,4,7))'。 (「class」是R中的一個特殊函數名稱,因此最好不要使用該名稱的變量)。 – MrFlick 2015-02-12 05:34:16

回答

1

當您調用data(mdrr)時,R會加載名爲「mdrr.Rda」的文件,該文件包含兩個對象,一個data.frame(mdrrDescr)和一個普通因子(mdrrClass)。對這些對象中的任何一個都沒有特別的要求(除了可能的因素長度與data.frame中的行數相同)。

如果你想創建一個包,其data('myData')負載兩個對象(比如,「a」和「B」),只保存那些對象在一個.Rda文件:

save(a=myFavoriteDataFrame, 
    b=myFavoriteFactor, 
    file='path/to/my/package/data/myData.Rda')