迴歸分析還是Anova？

我希望能成爲最清晰的人。比方說，我有10個變量，其中，其中4代表我具有某種現象，我稱之爲Y. 其他6代表了我另一種現象，我稱之爲X.迴歸分析還是Anova？

這些變量中的每一個（數據集10）包含37個單位。這些單位只是我分析的調查對象（一項調查）。由於所有的問題都是基於李克特量表，他們是定性的變量。對於所有這些人來說，這個比例從0到7，但是在缺少答案的地方有「-1」和「-2」值。因此，規模實際上從-2到7.

我想要做的是計算我的Y（其中包含4個變量在這種情況下，37個答案爲每個變量）和我的X（其中包含6相反的變量和相同數量的受訪者）。我知道，對於定性分析，我應該使用Anova而不是迴歸，儘管我已經在某處讀到甚至可能使用來進行迴歸。

到現在爲止我已經嘗試這樣的行爲：

> apply(Y, 1, function(Y) mean(Y[Y>0])) #calculate the average per rows (respondents) without considering the negative values 

> Y.reg<- c(apply(Y, 1, function(Y) mean(Y[Y>0]))) #create the vector Y, thus it results like 1 variable with 37 numbers 

> apply(X, 1, function(X) mean(X[X>0])) 

> X.reg<- c(apply(X, 1, function(X) mean(X[X>0]))) #create the vector X, thus it results like 1 variable with 37 numbers 

> reg1<- lm(Y.reg~ X.reg) #make the first regression 
> summary(reg1) #see the results 
Call: 
lm(formula = Y.reg ~ X.reg) 

Residuals: 
    Min   1Q  Median  3Q  Max 
-2.26183 -0.49434 -0.02658 0.37260 2.08899 

Coefficients: 
       Estimate Std. Error t value Pr(>|t|)  
(Intercept)  4.2577  0.4986  8.539 4.46e-10 *** 
X.reg   0.1008  0.1282  0.786 0.437  
--- 
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 

Residual standard error: 0.7827 on 35 degrees of freedom 
Multiple R-squared: 0.01736, Adjusted R-squared: -0.01072 
F-statistic: 0.6182 on 1 and 35 DF, p-value: 0.437

但正如你所看到的，雖然我不Y用的組成由4個變量和X 6，我不考慮負值也是如此，我的R^2得分非常低。

如果我用ANOVA行動，而不是我有這樣的問題：

> Ymatrix<- as.matrix(Y) 
> Xmatrix<- as.matrix(X) #where both this Y and X are in their first form, thus composed by more variables (4 and 6) and with negative values as well. 

> Errore in UseMethod("anova") : 
    no applicable method for 'anova' applied to an object of class "c('matrix', 'integer', 'numeric')"

說實話，前幾天我成功地用單因素方差分析，但不幸的是我不記得如何，我沒有保存命令任何地方。

我想知道的是：

首先，我錯了我在如何處理我的問題？
您如何看待迴歸輸出？
最後，我該如何做出anova？如果我必須這樣做。

來源

2012-05-15 Andrea

如果您的回答（Y）和預測變量（x）是數值範圍，則可以使用迴歸。如果您的答案（Y）是預測變量（x）的數字尺度是分類尺度，則可以使用方差分析。

建議：

在使用迴歸方法之前，您必須使用有效性和可靠性測試來了解答案（指標）是否對響應和預測變量有效且可靠。

來源

2013-12-21 04:14:40

我不同意Denny的回答。無論您擁有哪種數據類型，都可以使用任一種方法。如果您有分類數據，則可以使用虛擬編碼將其表示爲數字。例如，給定一個包含3個選項的特徵x，例如1,2和3，可以通過創建3個新的附加變量x1，x2和x3將其編碼爲數字。如果x是1，x1將是1，x2將是0，x3將是0。如果缺少x，則三個新的x值將全部爲零。

在你的情況下，我會建議你先嚐試迴歸，因爲你擁有的功能數量很多，而且它往往是直截了當的。隨着特徵數量的增加，方差分析可能變得複雜。假設你的數據符合兩種技術所要求的假設，兩者都應該有效。

來源

2014-08-05 08:34:54 HXSP1947

迴歸分析還是Anova？

回答

相關問題