2013-12-10 69 views
1

奇點我有一個數據庫,它是161 X 151,我申請我的數據集如下: -如何查看模型擬閤中插入符號列車中的R

> ctrl <- trainControl(method = "repeatedcv", number = 10, repeats = 10, savePred = T) 
> model <- train(RT..seconds.~., data = cadets, method = "lm", trControl = ctrl) 

因我所得到的回報

Coefficients: (82 not defined because of singularities) 

我知道這意味着我的很多變量是共線的,因此不是自變量。所以,我希望能夠看看我的數據的係數矩陣,所以我所做的: -

cor(cadets, use="complete.obs", method ="kendall") 

,但你可以想像的結果是大到它的所有適合我的R屏幕。有觀察模型矩陣,所以我可以看到哪些變量是共線彼此的一種方式,而且我還能從這裏開始做,以更好地改進模型,如果我的變量是共線的?我怎麼過來的?

由於在插入符號手冊的預處理部分所述(約半一路下滑頁)

回答

0

它: http://caret.r-forge.r-project.org/preprocess.html

這樣對你的學員數據是像(沒有測試):

cadetsCor <- cor(cadets) 
highlyCorCadets <- findCorrelation(cadetsCor, cutoff = 0.75) 
cadets <- cadets[, -highlyCorCadets] 

另一種方法是降維..如PCA但隨後你的模型可能獲得預測能力,但失去解釋性。

+0

非常感謝你,這真的有幫助! – user2062207

+0

@ user2062207然後請接受答案。 –