我正在使用glmnet包執行LASSO迴歸。我現在正在使用插入程序包研究功能重要性。我不明白的是重要性的價值。任何人都可以啓發我嗎?是否有任何公式可以計算這些值,或者這是否意味着這些值是基於beta值的? ROC curve variable importance
only 7 most important variables shown (out of 25)
我想在插入符號庫的train()後顯示混淆矩陣,但我有一些疑問。 「火車()」應該在火車上嗎?(我不確定是否因爲「控制」參數)。測試集中的「預測()」?這似乎不可思議,預測在整個數據集... # df_corpus = Document Term Matrix + 1 column of Cos.code(class which are 203.2.2, 204.3.2 ...)
dataset