我正在做一個R中的單因子方差分析,這是我過去成功完成的。但是這次它不斷地削減最後的變量。 我的數據是五列,CSV格式,數字從1-366。 樣本如下:方差分析中的變量缺失R
w x y z all_data
181 314 207 207 207
176 315 207 207 207
176 315 209 209 209
176 315 209 209 209
177 316 209 209 209
177 149 209 209 209
177 149 209 209 209
278 154 209 209 209
278 154 209 209 209
278 154 209 209 209
278 154 209 209 209
當我進行方差分析,這是我的結果。
> xdata <- read.csv("xdata.csv")
> wdatalm <- lm(all_data ~ w + x + y + z, data = xdata)
> anova(wdatalm)
Analysis of Variance Table
Response: all_data
Df Sum Sq Mean Sq F value Pr(>F)
w 1 1650752 1650752 5.2276e+31 < 2.2e-16 ***
x 1 2947290 2947290 9.3335e+31 < 2.2e-16 ***
y 1 9956250 9956250 3.1529e+32 < 2.2e-16 ***
Residuals 7969 0 0
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Warning message:
In anova.lm(nocollm) :
ANOVA F-tests on an essentially perfect fit are unreliable
我以不同的順序再試了一遍,得到了一個不同的結果,仍然缺少最終變量。
> zdatalm <- lm(all_data ~ z + w + x + y, data = xdata)
> anova(zdatalm)
Analysis of Variance Table
Response: all_data
Df Sum Sq Mean Sq F value Pr(>F)
z 1 14554292 14554292 2.6457e+31 <2e-16 ***
w 1 0 0 1.0400e-02 0.9188
x 1 0 0 0.0000e+00 0.9961
Residuals 7969 0 0
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Warning message:
In anova.lm(nocollm) :
ANOVA F-tests on an essentially perfect fit are unreliable
關於錯誤信息,我不知道我的數據可能過於接近一個合適的,但似乎並不認爲這應該會導致測試剪切變量。有什麼辦法可以阻止它這樣做嗎?