2017-07-26 112 views
0

有人可以幫助我解釋在多重回歸模型中測試多重共線性的別名函數輸出。我知道我模型中的一些預測變量高度相關,我想用別名表來標識它們。解釋別名表R測試模型的多重共線性

Model : 
Score ~ Comments + Pros + Cons + Advice + Response + Value + Recommendation 
+ 6Months + 12Months + 2Years + 3Years + Daily + Weekly + Monthly 

Complete : 
      (Intercept) Comments Pros Cons Advice Response Value1 
UseMonthly1  0   0 0 0 0  0   0     
      Recommendation1 6Months1 12Months1 2Years1 
UseMonthly1 0    1  1  1    
      3Years1 Daily1 Weekly1 
UseMonthly1 1   -1  -1  

價值,建議,6個月,12個月,2年,3年,每日,每週和每月的二元分類變量。
評分,評論,贊成,反對,建議和迴應是數字變量。

我可以假設UseMonthly與6個月,12個月,2年,3年,每日,每週高度相關嗎?別名輸出中的1和-1值有什麼區別?它是正面的和負面的相關性?

回答

0

「完整」矩陣中的非零項表明這些項與線性依賴於UseMonthly。這意味着它們高度相關,但術語可以高度相關而不依賴於線性。

如果您的目的是識別和刪除相關變量,您應該刪除UseMonthly,但您可能還需要刪除其他人。識別可能在多重共線性方面存在問題的變量的常用方法是搜索大的方差膨脹因子(通過例如car::vif計算)。