2013-06-21 82 views
1

我對預測Y感興趣並正在研究不同的兩種測量技術X1X2。例如,我想通過測量香蕉躺在桌上多久,或通過測量香蕉上褐色斑點的數量來預測香蕉的美味。線性模型:比較兩種不同測量方法的預測能力

我想知道哪一種測量技術更好,我應該選擇只執行一種。

我在R中可以建立一個線性模型:

m1 = lm(Y ~ X1) 
m2 = lm(Y ~ X2) 

現在讓我們說X1是香蕉鮮味比X2的優越預測。在計算兩個模型的R^2時,模型m1的R^2明顯高於模型m2。在寫一篇關於X1方法好於X2的文章之前,我希望有某種跡象表明差異不是偶然的,可能是以p值的形式。

怎麼會這樣呢?當我使用不同品牌的香蕉時,如何做到這一點,並轉向一種將香蕉品牌視爲隨機效應的線性混合效應模式?

+0

我可能會比較[均方預測誤差](http://stats.stackexchange.com/q/20741/11849) 。 – Roland

+0

使用'anova'函數比較模型:http://stats.stackexchange.com/q/53312/8464 – topchef

+1

只有當模型是嵌套模型時,才能將模型與'anova'進行比較,但這些模型不是。要求的測試可能最好使用AIC完成。 – John

回答

1

對不起,如果不理解你的權利。據我瞭解,這是簡單的基本統計問題,而不是R.

你把它們放在一起迴歸。每個係數的p值顯示它們是否顯着。您也可以將香蕉品牌視爲假人(如果沒有太多類型的話)。並做方差分析測試。 順便說一句,這兩種測量技術在不同的模型中都很重要?這些模型和組合模型中的R^2是什麼? 至於你的問題,看看R^2的定義,希望對你有幫助:)

+2

不,他們想比較模型。將兩個預測因子放在一個模型中,不會告訴你,這是更好的預測因子。 – Roland

+0

然後,如果兩者都分別顯着,則通過R^2進行比較。所以你可以說m1解釋Y是一定的百分比,高於m2 – Asayat

+0

把兩個預測變量都放在模型中告訴我們一些事情,如果其中只有一個預測變量會有顯着的p值。如果兩個預測變量的係數都較高,是對因變量影響較大的那個。要比較模型,你可以使用AIC,但我不認爲在這種情況下這是必要的... – vodka

相關問題