2012-08-28 26 views
0

我正在與R一起創建一些線性模型(使用lm())來收集我收集的數據。現在我並不擅長統計和我發現很難理解,通過R.產生解釋lm()彙總中的殘差值語句

我的意思是剩餘價值的線性模型的總結:Min1QMedian3QMax

我的問題是:這些價值是什麼意思,以及如何從這些價值中知道我的模型是否好?

這是我的一些剩餘價值。

Min: -4725611 1Q:-2161468 median:-1352080 3Q:3007561 Max:6035077 
+0

你的問題是毫無意義的。人們不會僅僅從殘差中評估擬合優度。將'summary(your_model)'的結果發佈到您的問題中,以使其更有意義。 – Andrie

+0

這不是一個真正的編程問題,任何經濟計量學教科書都會幫助你。我建議[這] [1]讓你閱讀,它很容易閱讀,它有很好的解釋例子。 [1]:http://www.amazon.com/Basic-Econometrics-Damodar-N-Gujarati/dp/0071123431 –

+2

線性迴歸假設殘差的正態分佈。略微違反這一假設並不成問題,但分佈應該至少是對稱的,即中位數應該接近於零,並且第一和第三四分位數的絕對值應該相似。當然,還有更好的診斷可用,例如幾個殘差圖。嘗試像plot(lm(your.y〜your.x))一些診斷圖。 – Roland

回答

3

線性迴歸(特別是相關的假設檢驗)的一個基本假設是殘差是正態分佈的,期望值爲零。輕微違反這一假設並不成問題,因爲統計數據非常穩健。但是,分佈應該至少是對稱的。

判斷正態性假設是否滿足的最好方法是繪製殘差。有許多不同的診斷圖,例如,你可以做到以下幾點:

fit <- lm(y~x) 
plot(fit) 

這會給你殘差對擬合值的情節和標準化殘差的QQ-情節。 summary(fit)給出的分位數對於快速檢查殘差是否對稱很有用。在那裏,最小值和最大值並不重要,但中值應該接近於零,第一和第三個值應該具有相似的絕對值。當然,如果你有足夠數量的值,這個檢查纔有意義。

如果殘差是不正常的分佈有以下幾種可能對付的是,例如,

  • 轉換,
  • 廣義線性模型,
  • 或非線性模型可能是更合適的。

有很多關於線性迴歸的好書,甚至還有一些很好的網絡教程。我建議至少仔細閱讀其中的一個。