2012-03-08 32 views
0

如果以前已經回答過,但是我覺得很難爲我的R問題得到答案!根據anova彙總的名稱數據框

我的問題涉及到如何以有用的方式存儲多個anova的結果。

我正在使用「AOV」的數據幀的子集進行方差分析,在同一時間比較兩個數據幀,使用下面的函數:

doAnova = function(first, second) { 
    aov(number ~ factor1+factor2, data=rbind(first, second)) 
} 

這用於每個子集比較針對「鹼基'的情況下,檢查重大差異。要通過多個數據集執行此,我用它在一個循環:

for (name in names) { 
    result = summary(doAnova(base,subject)) 
} 

我想要這個結果將被存儲在與包含「名稱」和「結果」的值的每一行的數據幀。

到目前爲止,我已經嘗試了存儲名單和向量的名稱和結果,然後嘗試從這些創建數據幀,但沒有設法得到這個權利。

我知道這可能很簡單,但任何人都可以幫助解決這個問題嗎?

感謝

回答

1

你似乎是在分析所有數據的更標準的做法最終各地做,然後做事後測試,以檢驗子集進行比較。統計人員通常會認爲這是無原則的數據疏浚。也爲aov幫助頁說:

「注意

aov被設計爲適合平衡的設計,其結果是很難不均衡來解釋:提防的是,在返回的結果遺漏值將可能丟失平衡。」

所以我認爲你應該用識別因子變量來編碼你的子集,並使用R提供的用於分析不平衡設計的設施,即lm。只有在您以全球的方式檢查了估計的效果之後,才能轉向適當的事後測試,這些測試允許對多重比較問題進行原則性更正。

+0

鑑於每個子集已經可以被這樣一個變量識別(目前用於子集),這可能是我應該做的。不幸的是,統計數據並不是我的強項,所以我不完全清楚 - 什麼使設計平衡/不平衡?我會研究'lm'作爲替代方案 – obfuscation 2012-03-08 15:07:04

+0

http://en.wikipedia.org/wiki/Glossary_of_experimental_design – 2012-03-08 15:27:10

+0

我有1個'正常'條件和40個獨立的條件,每條50行,然後與值爲13個獨立變量。這符合平衡的描述不是嗎?而且,在我參與更多「無原則性數據苦讀」之前,您是否對本案例中的整個數據有任何適當的測試提示? – obfuscation 2012-03-08 15:43:40