2015-07-21 48 views
0

例如,一個產品的數量與價格, 如果我發現了具體的數量,價格太離譜了, 有沒有統計數字顯示多少區別於R中迴歸線的點?如何在線性迴歸中測量異常點距離R

或讓我們說如何測量從圖上特定點到迴歸線的距離? 感謝您的輸入

+0

減法對分歧很有效。預測()對於得到一個點的模擬預測效果很好。您也可以查看內置於大多數模型對象的殘差。 – Gregor

回答

2

我相信你正在尋找殘差。

殘差是通過執行

M <- lm(a~b) 
M$residuals 

定義爲 e = y - ŷ

可以讓他們R上雖然,幾何上說,這將是該線的垂直距離,正交於x軸,而不是從觀察點到線上最近點的距離,這與線本身是正交的。

+0

此外,如果您正在尋找一個適合您的模型的一般衡量標準,您可以查看[決定係數](https://en.wikipedia.org/wiki/Coefficient_of_determination)。這可以通過'summary(M)$ r.squared'和'summary(M)$ adj.r.squared'在R中獲得。通常使用'summary(M)'包含有用的信息。 – SSWilks

+0

感謝你,那麼你是如何確定這一點是否真的是異常的? – user35631

+0

@ user35631給出樣本中每個點的殘差。沒有一個「正確的方法」來確定異常值。如果你想檢查「殘留物太多」的點,你需要定義多少「太多」。其中一種方法是找到區間[Q1-3.5D,Q3 + 3.5D]以外的殘基,其中D = Q3-Q1。 Q1和Q3是所有殘基的第一和第三四分位數。但是,例如,您可以將3.5更改爲1.5。它真的歸結爲挑選異常值的定義。 [異常值](https://en.wikipedia.org/wiki/Outlier)以獲取更多信息。 – SSWilks