2012-05-03 54 views
0

在R中運行多重回歸之後,迴歸總結指示具有恆星的重要變量。在我正在研究的數據集中,有近2000個變量,由R標識的重要變量包含50多個變量。從迴歸總結中可以單獨獲得重要變量的列表嗎?在R中,如何在運行具有大量變量的多重回歸之後僅提取重要變量

+1

這是一種不科學的調查方法。您的「重要」結果的百分比低於單憑偶然因素所預期的百分比。這意味着就結果而言,你可以有一個很大的「零」。嘗試用隨機數字設置數據矩陣,您將看到與您描述的內容非常相似的內容。 –

回答

10

這就是爲什麼你不應該做一個例子,你要我們做什麼:

randf <- as.data.frame(matrix(rnorm(800*400), 800, 400)) 
names(randf)[1] <- "Y" 
big.mod <- lm(Y ~ ., data=randf) 
sum(summary(big.mod)$coefficients[ ,4] < 0.05) 
#[1] 22 

所以我們得到22個顯著係數(他們中的一些「非常顯著」)剛剛回歸對400個隨機變量另一個隨機變量。