2016-02-23 65 views
0

我已經運行了一系列多重線性迴歸模型的和正在使用的方式從這個鏈路(http://www.r-bloggers.com/checking-glm-model-assumptions-in-r/線性迴歸劇情與錯誤標記離羣

我對每個不超過53個數據點發現的方法和代碼運行診斷圖模型,但是迴歸圖中的一些異常值被標記爲53 ...,範圍從58-107。迴歸圖中的異常值或影響點的標籤是否與每個單獨的數據點不相關?如果是這樣,標籤是什麼意思,我怎麼知道我的哪些數據點是異常值?我在地塊計算我的數據點,他們都沒有超過53

我重視我的迴歸圖輸出的屏幕截圖。有53個在這個情節,然而兩個顯着的點被標記爲90和106迴歸劇情例如

enter image description here

+0

當問問題,它有助於包括[可重複的例子(http://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example),這樣我們就可以驗證出了什麼問題而不是顧ESS。在擬合模型之前,您是否在某個時候對數據進行了分類?標籤可能是data.frame的行名,而不是行索引。 – MrFlick

回答

0

plot.lm標籤與相應的行名點:

set.seed(42) 
DF <- data.frame(x = 1:5, y = 2 + 3 * 1:5 + rnorm(5)) 
rownames(DF) <- letters[1:5] 
DF$y[3] <- 1e3 

mod <- lm(y ~ x, data = DF) 
par(mfrow = c(2,2)) 
plot(mod, 1:4) 

resulting plot

+0

羅蘭,我感謝您的反饋,但還是不明白。我指的是我圖表上外圍圓圈附近的標籤。例如,在殘差與擬合圖上,它在左上角的點附近表示90。這是什麼意思?我在這個模型中只有53個數據點。 –

+0

我不知道你有什麼不明白。 90是該觀察的行名稱。顯然你的data.frame是一個子集操作的結果。 – Roland

+0

例如,看一下'DF [ 「90」,]'(其中'DF'是你data.frame)。 – Roland