0
我用mice
創建一些多重插補數據集:對於α和拉姆達同時重複的λ和α交叉驗證與glmnet/glmnetUtils
library(glmnetUtils)
library(mice)
nhanes <- mice::nhanes
imp <- mice(nhanes)
com <- complete(imp, "long")
使用glmnetUtils
,有可能交叉驗證:
nhanes$hyp <- factor(nhanes$hyp)
fit <- cva.glmnet(hyp ~ ., data = nhanes, alpha = seq(0, 1, 0.05), family = "binomial")
問題:
- 如何使用
glmnetUtils
運行重複交叉驗證? - 我該如何平行化過程?我真正的訓練數據集有71,200個觀測值,大約需要4個小時才能完成一次交叉驗證。