我希望能成爲最清晰的人。 比方說,我有10個變量,其中,其中4代表我具有某種現象,我稱之爲Y. 其他6代表了我另一種現象,我稱之爲X.迴歸分析還是Anova?
這些變量中的每一個(數據集10)包含37個單位。這些單位只是我分析的調查對象(一項調查)。 由於所有的問題都是基於李克特量表,他們是定性的變量。對於所有這些人來說,這個比例從0到7,但是在缺少答案的地方有「-1」和「-2」值。因此,規模實際上從-2到7.
我想要做的是計算我的Y(其中包含4個變量在這種情況下,37個答案爲每個變量)和我的X(其中包含6相反的變量和相同數量的受訪者)。我知道,對於定性分析,我應該使用Anova而不是迴歸,儘管我已經在某處讀到甚至可能使用 來進行迴歸。
到現在爲止我已經嘗試這樣的行爲:
> apply(Y, 1, function(Y) mean(Y[Y>0])) #calculate the average per rows (respondents) without considering the negative values
> Y.reg<- c(apply(Y, 1, function(Y) mean(Y[Y>0]))) #create the vector Y, thus it results like 1 variable with 37 numbers
> apply(X, 1, function(X) mean(X[X>0]))
> X.reg<- c(apply(X, 1, function(X) mean(X[X>0]))) #create the vector X, thus it results like 1 variable with 37 numbers
> reg1<- lm(Y.reg~ X.reg) #make the first regression
> summary(reg1) #see the results
Call:
lm(formula = Y.reg ~ X.reg)
Residuals:
Min 1Q Median 3Q Max
-2.26183 -0.49434 -0.02658 0.37260 2.08899
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 4.2577 0.4986 8.539 4.46e-10 ***
X.reg 0.1008 0.1282 0.786 0.437
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.7827 on 35 degrees of freedom
Multiple R-squared: 0.01736, Adjusted R-squared: -0.01072
F-statistic: 0.6182 on 1 and 35 DF, p-value: 0.437
但正如你所看到的,雖然我不Y用的組成由4個變量和X 6,我不考慮負值也是如此,我的R^2得分非常低。
如果我用ANOVA行動,而不是我有這樣的問題:
> Ymatrix<- as.matrix(Y)
> Xmatrix<- as.matrix(X) #where both this Y and X are in their first form, thus composed by more variables (4 and 6) and with negative values as well.
> Errore in UseMethod("anova") :
no applicable method for 'anova' applied to an object of class "c('matrix', 'integer', 'numeric')"
說實話,前幾天我成功地用單因素方差分析,但不幸的是我不記得如何,我沒有保存命令任何地方。
我想知道的是:
- 首先,我錯了我在如何處理我的問題?
- 您如何看待迴歸輸出?
- 最後,我該如何做出anova?如果我必須這樣做。