2014-03-26 26 views
2

我有這樣一個模型:

lmer(y ~ x + z + (1|g) + (1|dummy) , data = dat) 

dummy是個人層面隨機效應占過度分散,即factor(1:nrow(dat))

當運行此我得到以下錯誤,我不明白。這是否意味着我配備了我的模型?

錯誤checkNlevels(reTrms $的flist,N = N,控制): 數每個分組因子的水平必須是<若干意見

當我與poisson家庭然而運行這個模型例如,我沒有得到這個錯誤

glmer(y ~ x + z + (1|g) + (1|dummy) , data = dat, family = poisson) 

我知道在個人層面隨機效應甚至可能沒有什麼意義高斯GLMM,但我想知道,如果泊松例子是從我的難言之隱,這表明該模型在裝?

回答

3

在正常模型中,過分散並不是一個真正有用的概念,因爲它已經適合觀測水平變異的變異。所以錯誤信息告訴你在觀察級別你不能有一個分組因子。從這個意義上說,是的,你正試圖過度使用你的模型。然而,在泊松(或其他glm)模型中,它的確是有意義的,因爲根據glm中的任何方差項,觀察水平的變化是固定的,所以增加一個額外的方差項來考慮觀測水平的任何額外變化。因此glmer不會執行與lmer相同的檢查。

+0

希望我能夠堅持下去,等待看到你的答案......我的情況更爲詳細,但你的情況很好,可以爲我節省麻煩。 –

+0

同樣的想法在這裏... – Aaron

+0

非常感謝,我真的得到了這個錯誤,沒有添加在泊松家庭,我擔心有什麼事情我沒有得到,這是真的,但不是太害怕的東西。非常感謝@BenBolker和Aaron – user1320502

2

這確實是更有點CrossValidated問題的,但:

  • 線性混合模型的定義包括通過默認的殘餘方差項;換句話說,該模型已經估計了殘差的彌散量。如果在公式中包含觀察級隨機效應,則其方差將與殘差相混淆(這兩個項將是聯合不可識別的;將會有一組同樣適合模型的兩個方差之和到一個常量)。這個問題不一定會嚴重影響模型的其他部分,但包含這樣一個無法識別的術語通常是意味着你犯了一個錯誤/不太明白你在做什麼,所以默認行爲是在這種情況下返回一個錯誤。如果你有一個很好的理由來適應這種模式,你可以使用lmerControl覆蓋錯誤。
  • 最常見的廣義線性混合模型(即泊松和二項式)的定義是而不是包括殘差方差項 - 具體地說,泊松和二項模型的「尺度參數」根據定義固定爲1 。因此,數據中可能存在過度分散。處理這個問題的標準方法之一是添加一個觀察級別的隨機效果,如上所述。由於模型中沒有默認的殘差方差項,因此沒有任何可疑內容,並且glmer不會發生抱怨。

參見例如, http://glmm.wikidot.com/faq#overdispersion_est瞭解更多詳情和參考。

+0

謝謝本我因爲錯誤信息內容 – user1320502

+0

而被碰撞到了這裏,有趣;這些網站之間肯定有時會有重疊,但是這似乎也適合於交叉驗證。我很確定那裏甚至有一個近似重複的地方,但在我簡短的搜索中沒有找到它。 – Aaron

+0

@Ben Yeah有時候,當事情處於邊緣時,人們就會雙重推both。我實際上有一個模型,其中隨機效果的複製非常低,因此接近個人水平效果,所以'lmerControl'實際上可能非常有用。 – user1320502