2013-04-29 123 views
4

我想知道使用svyglm或加權glm之間的區別是什麼。svyglm和加權glm之間的區別

例如:

M1 = glm(formula = yy ~ age + gender + country , 
     family = binomial(link = "probit"), 
     data = P2013, 
     subset = (P2013$E27>=14 & P2013$E27<=17), 
     weights = P2013$PESOANO) 

或定義樣本設計爲:

diseño = svydesign(id =~ NUMERO, 
        strata =~ ESTRATOGEO, 
        data = p2013, 
        weights = P2013$PESOANO) 

diseño_per_1417 = subset(diseño, (P2013$E27>=14 & P2013$E27<=17)) 

,然後使用svyglm

M2 = svyglm(formula = yy ~ age + gender + country, 
      family = quasibinomial(link = "probit"), 
      data = P2013, 
      subset = (stratum=!0), 
      design = diseño_per_1417) 

在我使用M2svyglm)的情況。我可以使用什麼來比較模型,比如逐步地對glm模型進行比較?

謝謝, 納塔利婭

回答

2

help(glm)

非空的權重可以被用於指示不同的觀察具有不同的分散體(與權重爲反比於分散體中的值);或者等價地,當權重元素是正整數w_i時,每個響應y_i是w_i單位重量觀測值的均值。對於二項式GLM,在響應是成功比例時,先用權重給出試驗次數:它們很少用於泊松GLM。

我不認爲你正在尋找這些權重。從你的例子看來,你正在處理分層調查。你一定要使用surveyglm

+0

謝謝弗洛裏安!但是你知道那麼估計使用svyglm?或者我可以在書中找到發展的地方? – Natuk 2013-05-02 00:28:27

+1

'svyglm'做了一些與你的設計有關的工作(重量,地層等),但最終稱爲「glm」。所以你應該看看'?glm'。基本上通過在你的例子中指定'family'來設置你想要使用的鏈接函數(它對應於「logit」或「probit」等)。 Kleiber&Zeileis 2008(p122)給出了一個簡明的解釋。也請查看調查包的[網站](http://staff.washington.edu/tlumley/survey/)。如果您認爲有幫助,請接受我的回答。 – 2013-05-02 08:09:44

+1

是的,已經在不同的書籍和調查軟件包中檢查過,但我找不到這是svyglm使用的估算器。我認爲svyglm並不是最大可能估計的,可能是Horvitz Thomson估計量?我想找一個詳細解釋的文本。謝謝! – Natuk 2013-05-02 17:00:47