2015-02-24 100 views
0

我在R中還是比較新的,我有一個可能很容易的問題,我希望你能回答。分層抽樣

我工作的數據集:GSS 2010。我有一個每個答辯人的ID,我有9個數字級別的變量'區域'。在所有2044個794個變量的觀察中。

我想繪製一個大小爲100的樣本,每個分層的樣本都與其人口規模(完整的GSS)成比例。

我已經看過包中的「採樣」和「調查」,但不幸的是我還沒有能夠畫出樣本。

到目前爲止,我最好的猜測是這樣的:

#Stratified subsample of GSS2010; regions as strata 
s=strata(GSS2010,c("region"),size=c(100), method="systematic", pik=id$region) 

我希望你能幫助。非常感謝你提前。

最佳, 蘇菲

+0

您可以查看我的「splitstackshape」包中的「stratified」函數或「dplyr」中的'sample_frac'。你的問題現在還不夠清楚。 – A5C1D2H2I1M1N2O1R2T1 2015-03-07 15:08:43

回答

0

我覺得 樣品 功能的基礎R應該足夠:

s <- GSS2010[sample(dim(GSS2010)[1]),] 

這將選擇百行中的數據幀。每個區域被選中的概率將與數據幀中該區域的行數成正比。

如果這不是你想請編輯的一句話

什麼「與比例採樣,其人口規模(全部GSS)各階層。」

爲了更清楚。