2012-07-24 27 views
0

我試圖適應R.我有很大的血統和基因型數據廣義線性混合模型系列ID。我嘗試這樣做:以指定用作GLMM或隨機效應LME

m1 <- lmer(Final_sx~(1 | ID)+cohort2+cohort3+cohort4+sex, 
      data=solar_new_phen,family=poisson) 

它給我留言:

的隨機效果的聚合因子的水平數是 等於爲n,觀測的數量

我在大多數教程中看到人們使用ID作爲聚類變量。在親情包,以及在lmekin功能是這樣的:

rand.eff=formula(paste("~1|",sub.ID)) 
fit <- try(lmekin(fixed=fix.eff,data=x,random = rand.eff,varlist=list(kmat))) 

我應該使用單獨的ID或家庭ID作爲隨機效應?我很困惑。我有家譜,我想我應該使用Family ID作爲聚類變量。如果有人能夠引導我對關於隨機效應的小解釋,那將是很棒的。

+0

[此問題](http://stats.stackexchange.com/q/18563/3601)在上交叉驗證是相關的並可能有所幫助。 – Aaron 2012-07-24 18:49:41

+1

如果您想要爲家庭估算單獨的方差分量,那麼您應該可以使用公式的隨機效應部分的「家族ID」。如果您希望您的回答在家庭中相關,例如(可能會這樣),這是有道理的。如果每個人都有多次觀察,你可以(另外)包括一個可能與家庭水平隨機效應相關的個體水平隨機效應。它不會出現你做的。我會重新格式化你的問題,並問stats.stackexchange.com如果你的問題是更多的統計性質。 – lockedoff 2012-07-24 19:02:03

回答

1

因爲你可能只有一行ID!爲此,您需要許多obs爲1 ID