在R的調查包中如何使用BRR權重？

有誰知道如何使用Lumley的調查包中的BRR權重來估計方差，如果您的數據集已經有的BRR權重了嗎？在R的調查包中如何使用BRR權重？

我正在使用PISA數據，他們已經在他們的數據集中包含了80個BRR重複數據。我怎樣才能得到.svrepdesign使用這些，而不是試圖創建自己的？我嘗試了以下，並得到了後續的錯誤：

dstrat <- svydesign(id=~uniqueID,strata=~strataVar, weights=~studentWeight, 
       data=data, nest=TRUE) 
dstrat <- as.svrepdesign(dstrat, type="BRR") 

Error in brrweights(design$strata[, 1], design$cluster[, 1], ..., 
    fay.rho = fay.rho, : Can't split with odd numbers of PSUs in a stratum

任何幫助將不勝感激，謝謝。

來源

2012-10-16 RickyB

與R在比薩工作，[this]（http://www.asdfree.com/search/label/program%20for%20international%20student%20assessment%20%28pisa%29）將做正確的設置爲你:)你需要在你的分析中加入多重插補，這些腳本自動化。 –

無需使用as.svrepdesign()如果您有一個數據框與複製權重已經:)您可以直接從您的數據框創建複製加權設計。

說你有一個稱爲主重列數據mainwgt和80名爲repwgt1複製權重列通過repwgt80您可以使用此 -

yoursurvey <- 
    svrepdesign( 
    weights = ~mainwgt , 
    repweights = "repwgt[0-9]+" , 
    type = "BRR", 
    data = yourdata , 
    combined.weights = TRUE 
)

- 這樣，你就不必識別確切的列號。那麼你就可以運行正常調查命令，如 -

svymean(~variable , design = yoursurvey)

，如果你想另一個例子，這裏使用當前人口調查局的some example code和an explanatory blog post。

來源

2012-10-25 16:33:57

是不是需要指定'type'和'rho'參數？我想有人需要知道重複權重的具體設計知道嗎？ – ako

我認爲類型默認爲「BRR」，但不是100％。 rho只需要type =「Fay」[示例]（https://github.com/ajdamico/usgsd/blob/9be971706a69f4e569a7d5643eab602a5c27b311/Current%20Population%20Survey/2012%20asec%20-%20analysis%20examples.R#L80 ）。 :) –

如果您使用任何「合理值」變量（這可能是任何分析的核心），此答案是不夠的。要正確使用這些設置，請使用[此設置代替]（http://www.asdfree.com/search/label/program%20for%20international%20student%20assessment%20%28pisa%29）。 –

我還沒有使用PISA數據，去年我使用了svprepdesign方法，使用美國社區調查（美國人口調查局）提供的公共使用樣本，該樣本還附帶80個重複權重。他們狀態下使用的Fay方法對於具體調查，所以這裏是一個如何可以利用這些數據構建svyrep對象：

pums_p.rep<-svrepdesign(variables=pums_p[,2:7], 
    repweights=pums_p[8:87], 
    weights=pums_p[,1],combined.weights=TRUE, 
    type="Fay",rho=(1-1/sqrt(4)),scale=1,rscales=1) 

attach(pums_p.rep) 
#CROSS - TABS 
#unweighted 
xtabs(~ is5to17youth + withinAMILimit) 
table(is5to17youth + withinAMILimit) 

#weighted, mean income by sex by race for select age groups 
svyby(~PINCP,~RAC1P+SEX,subset(
    pums_p.rep,AGEP > 25 & AGEP <35),na.rm = TRUE,svymean,vartype="se","cv")

在得到這個工作，我發現article從A達米科有所幫助：Damico, A. (2009). Transitioning to R: Replicating SAS, Stata, and SUDAAN Analysis Techniques in Health Policy Data. The R Journal, 1(2), 37–44.

來源

2012-10-16 03:05:42 ako

你是否使用PISA數據處理它？ – ako

使用Anthony的解決方案效果很好，謝謝！ – RickyB

在R的調查包中如何使用BRR權重？

回答

相關問題