2011-05-30 160 views
1

如您所知,使用CORRB選項,您可以讓SAS中的邏輯迴歸或線性迴歸輸出估計矩陣的相關性。有趣的是,我不確定如何閱讀這個矩陣。我有兩個明顯強烈正相關的變量。從PROC CORR,我可以看到這兩個變量的皮爾森相關係數是0.7+。但是,來自logitistic迴歸和線性迴歸的估計矩陣給我-0.7。相關的強度大致相似,但符號相反。任何人都可以解釋它?非常感謝。如何通過SAS中的PROC LOGISTIC和PROC REG讀取相關矩陣輸出?

+0

一般來說,你應該問stats.stackexchange.com統計問題 - 他們將得到更多的關注 – Aniko 2011-05-31 15:18:35

+0

Aniko,謝謝你的建議。 – Steve 2011-06-01 04:13:22

回答

3

您正在讀取的值是正確的,它們只是指不同的東西。 PROC CORR給出變量的相關性,而CORRB是模型中這些變量係數的相關性。

下面是爲什麼正相關預測因子將具有負相關係數的直觀解釋。假設y = a + b1*x1 + b2*x2 + eps。如果您將b1增加一點從迴歸得到的最佳值,那麼y的預測值也會增加(對於正數x1),並且會使總體擬合更糟糕。一種方法來補償這一點,並移動預測值更接近觀察到的是減少b2:因爲高值x1與高值x2相關聯,您將回到接近原始擬合。這表明b2中的不確定性與b1中的不確定性呈負相關:增加一個而減小另一個會導致類似的擬合。

查看完美關聯的極端情況可能非常有益:x2=x1。那麼下面將給你一模一樣的預言:

y = 1 + 2*x + 3*x 
y = 1 + 3*x + 2*x 
y = 1 + 9*x + (-4)*x 
etc 

所以b2 = 5-b1和係數有一個完美的負相關關係。

+0

很好的解釋。謝謝。 – Steve 2011-06-01 02:41:11