我運行glm
並得到結果。現在我想得到那些在95%顯着的預測變量的名稱,即p值小於或等於顯着性水平5e-2。我運行:如何矢量化提取重要的預測變量?
fit <- glm(data=dfa, formula=response~.)
sig <- summary(fit)$coefficients[,4]
(Intercept) close0 close1 close2 close3 close4 closema open0
0.000000e+00 3.147425e-19 7.210909e-04 1.046019e-02 4.117580e-03 2.778701e-01 2.829958e-05 0.000000e+00
open1 open2 open3 open4 openma low0 low1 low2
8.627202e-30 1.138499e-02 1.112236e-03 7.422145e-03 3.967735e-03 3.036329e-42 3.033847e-05 3.237155e-01
low3 low4 lowma high0 high1 high2 high3 high4
8.198750e-01 6.647138e-02 4.350488e-05 6.177130e-58 2.625192e-02 4.143373e-01 3.964651e-01 3.694272e-01
highma volume0 volume1 volume2 volume3 volume4 volumema
1.416310e-05 8.027502e-02 1.975302e-01 1.630341e-09 8.979313e-03 1.274195e-06 8.246661e-01
> str(sig)
Named num [1:31] 0.00 3.15e-19 7.21e-04 1.05e-02 4.12e-03 ...
- attr(*, "names")= chr [1:31] "(Intercept)" "close0" "close1" "close2" ...
什麼是「命名的數字」類型呢?
我想有列名的數組喜歡這樣,因爲這些預測變量具有以下顯着性水平5E-2即
best <- c('close0', 'close1', 'close2', 'close3', 'closema', ... etc)
注意p值的close4
是不存在的......我怎麼能以矢量化的方式提取這些列名稱?
更新:我制定瞭如何做一個循環
fit <- glm(data=dfa, formula=response~.)
summary(fit)
sig <- summary(fit)$coefficients[,4]
best <- NULL
columnLabels <- names(sig)
for (columnLabel in columnLabels) {
if (as.numeric(sig[columnLabel]) <= 5e-2) {
if (is.null(best)) {
best <- columnLabel
} else {
best <- c(best, columnLabel)
}
}
}
請問'name(sig <5e-2)'是嗎? – James
謝謝,但不,不起作用,''就像給我所有列名稱。 –