2013-10-18 30 views
-1

我必須使用svyset在Stata中設置調查設計。我對翻譯調查結構的描述有點困惑。Stata svyset設計

實際上這是一個分層調查。首先根據公司的活動部門(NOGA 2)再根據公司的規模(size)對抽樣人口進行細分。沒有替換的SRS被完成。 如果在1-15名員工之間,則大小爲1;如果大於50,則大小爲16-50和3之間。 調查生產者給我noga_2代碼,所述size和被叫strata變量是從noga_2size(換句話說,它具有對於兩個的每一個組合的不同的值)的交點而建,

I」不能確定我是否必須使用

svyset [pweight=gewibgrs], strata(stra_n) 
    svyset nog_2 [pweight=gewibgrs], strata(stra_n) 
    svyset nog_2 [pweight=gewibgrs] || size, strata(stra_n) 

還是其他什麼東西...... 任何幫助,將不勝感激 詩下面有抽樣方案的原始描述

Dans le cadre de la LSE,les entreprises suisses ontétérépartiesen st st selon la branche d'activité(classes NOGA 2),la taille(en fonction du nombre d'employés:de 3à19,de 20à49 等)。 Dans ces strates,un tiragealéatoiresimple sans remise aétéeffectué,puis,dans chaque entreprise,des salaires ontétésélectionnés, nouveau selon un tirage simple sans remise。

謝謝你的回答。如果我不清楚,我很抱歉。

lSE是調查的名稱。

據我所知,從技術文件中,給定數量的企業是隨機選擇(沒有替換)給定的地層(由企業規模「大小」,行業「nog_2」和地區)地層信息存儲在變量stra_n中(stra_n也可以通過組合nog_2和大小來恢復)。

然後從所選公司隨機選擇不同百分比的員工(公司的ID也在數據集「brn_ree」中)。如果公司規模較小,所有員工都被選中,如果是中型企業,大約有50%的員工被選中,如果選擇了大約30%左右的員工。

更進一步的複雜性來自於這樣一個事實,即對於某些地區所有在該地區經營的公司都是被選中的。 在這種情況下,如果我必須使用區域版本的調查工作,假設stra_n中的信息不相關是否正確?

我理解正確你以前的答案對於整個調查我應該有:

svyset brn_ree [pweight = gewibgrs], strata(stra_n) 

而對於區域一個我應該有:

svyset brn_ree [pweight = gewibgrs] 

(還因爲,如果我寫的第一聲明爲區域調查沒有方差計算,因爲它警告只有一個觀察層可用)。

再次感謝您的幫助

回答

2

,因爲它是基於錯誤的信息,我已經刪除了我原來的答覆。

在這一點上,您的問題已經超出了Stata編碼的具體問題,擴展到依賴於研究設計細節和分析目標的問題。因此,我建議你將它指向Statalist。我只會在這裏說,你的解決方案單個單位的問題是不正確的。一個好的解決方案需要多步驟的方法,其中一部分可能因地區而異。

仍存在不確定性。您使用分層變量「strat_n」,您可以通過組合扇區和大小來恢復。這個描述是錯誤的嗎?如果不是,包含區域貢獻的分層變量是什麼?您提到「調查的區域版本」;我認爲你的意思是限於一個地區的分析。

在發佈到Statalist之前,請確保您的帖子遵循常見問題指南(http://www.stata.com/support/faqs/resources/statalist-faq/)。要特別注意第三節。爲了獲得最佳的幫助,不僅要描述抽樣設計,還要描述分析的目標。