我目前使用R通過使用隨機森林迴歸來執行特徵選擇。我想70:30分割我的數據,這很容易做到。但是,我希望能夠這樣做10次,每次10次獲得與之前不同的一組示例。如何分割數據70:30並在每次分割時獲取不同範圍的數據
> trainIndex<- createDataPartition(lipids$RT..seconds., p=0.7, list=F)
> lipids.train <- lipids[trainIndex, ]
> lipids.test <- lipids[-trainIndex, ]
這就是我現在正在做的事情,它對我的數據70:30分裂很有效。但是當我再次執行此操作時,我的訓練集中有70%的數據相同,而我的測試數據中也有相同數據的30%。我知道這是createDataPartition的工作原理,但是有什麼方法可以讓我在下次執行時獲得不同的70%的數據?
感謝
我還沒有使用'createDataPartition',但不能只使用'sample'來獲得隨機索引值和這些索引的子集嗎? – TheComeOnMan
將來,請包含您使用的軟件包,因爲'createDataPartition'不在base R.您是否找到'times'參數? – Justin
@Codoremifa我還沒有遇到過示例,但它似乎是我的問題的答案。謝謝! – user2062207