2013-02-06 33 views
0

我有一個非常大的數據集,我從數據倉庫中提取。要將數據集下載到我想要運行lme4的盒子需要很長時間。我想知道是否可以將數據處理爲協方差矩陣,然後下載該數據(該數據要小得多),並將其用作lme4的數據輸入。對於使用SAS的多元迴歸模型,我已經做了類似的事情,並且希望我可以爲lme4創建這種類型的輸入。有沒有辦法輸入協方差矩陣(或類似的東西)到R中的Lme4?

謝謝。

+0

我不這麼認爲。說實話,在我看來,方差 - 協方差矩陣實際上不會包含足夠的信息來運行混合模型......?我實際上建議你重新發布'r-sig-mixed-models @ r-project.org',那裏有更多專家的目光在觀看。 –

+0

謝謝。我去做。 – user2047451

回答

1

我不知道有什麼方法可以使用觀察到的協方差矩陣來擬合lmer模型。但如果目標是爲了加快分析而減少數據集的大小,可能會有更簡單的方法。例如,如果您不需要隨機效應的條件模式,並且您有很大的樣本量,那麼您可以嘗試將模型擬合到逐漸增大的數據子集,直到估計出固定效應和協方差隨機效應矩陣「穩定」。這種做法在我的經驗一直行之有效,被別人已經討論:

http://andrewgelman.com/2012/04/hierarchicalmultilevel-modeling-with-big-data/

下面是另一個報價:

「相關的‘多模式’的做法是加快計算簡單的近似。計算機越來越快,但模型變得越來越複雜,所以這些一般的技巧可能仍然很重要,一個簡單而普遍的技巧是將數據分解成子集並分別分析每個子集,例如,打破85個縣的氡數據隨機分爲三組30,30和25個縣,並分別分析每組。 Gelman和Hill(2007),第547頁。

相關問題