1
我在R中使用boot
包來計算自舉SE和置信區間。我試圖找到一個優雅而有效的方法來獲取我的參數的名稱以及它們的估計值的引導程序分佈。例如,考慮給予here簡單的例子:使用R Bootstrap獲取迴歸係數名稱
# Bootstrap 95% CI for regression coefficients
library(boot)
# function to obtain regression weights
bs = function(data, indices, formula) {
d = data[indices,] # allows boot to select sample
fit = lm(formula, data=d)
return(coef(fit))
}
# bootstrapping with 1000 replications
results = boot(
data=mtcars,
statistic=bs,
R=1000,
formula=mpg~wt+disp)
這工作得很好,但結果只是顯示爲數值指標:
# view results
results
Bootstrap Statistics :
original bias std. error
t1* 34.96055404 0.1559289371 2.487617954
t2* -3.35082533 -0.0948558121 1.152123237
t3* -0.01772474 0.0002927116 0.008353625
特別是進入長期的,複雜的迴歸公式時,涉及可能需要一些工作來精確跟蹤哪些指數與哪些係數估計值相符。
我當然可以在引導程序功能之外重新適合我的模型,並用names(coef(fit))
或其他東西提取名稱,或者使用其他名稱,例如調用model.matrix()
。這些看起來很麻煩,無論是在額外的編碼方面,還是在額外的CPU和RAM資源方面。
如何在這種情況下更容易地獲得係數名稱的一個很好的矢量以配對係數標準錯誤的矢量?
UPDATE
基於從LMO偉大的答案,這裏是我的基本代碼,以獲得一個基本的迴歸表:
Names = names(results$t0)
SEs = sapply(data.frame(results$t), sd)
Coefs = as.numeric(results$t0)
zVals = Coefs/SEs
Pvals = 2*pnorm(-abs(zVals))
Formatted_Results = cbind(Names, Coefs, SEs, zVals, Pvals)
'attr(results $ t0,「names」)';從看'str(results)' – user20650