2013-03-28 57 views
6

我正在分析有關簧片場的數據。我測量的變量是水深,蘆葦高度,蘆葦密度等。由於一些變量是相關的,爲了將這些變量減少到2個PCA軸(N = 104),我執行了PCA。提取PCA軸進行進一步分析

爲了執行PCA我用vegan包河我的數據是這樣的:

row.names Waterpeil hoogte_max Som Leeftijd_riet PFD oppervlakte onderlaag_num afst_rand 
1 1 5 2.5 51 0.15686274 1.616921 8.127192 2 24.154590 
2 3 9 2.5 44 0.13636364 1.564643 9.023642 2 8.349288 
3 4 0 2.5 84 0.30952381 1.352548 8.498775 2 26.226896 
4 5 0 3.5 58 0.43103448 1.384183 9.301617 1 57.320000 
5 6 40 2.5 52 0.42307692 1.361262 10.316058 1 45.470000 
6 7 5 3.0 19 0.00000000 1.429287 9.927788 1 36.720000 
7 9 0 2.5 64 0.28125000 1.355100 8.029911 2 19.560000 
8 11 120 3.5 29 0.03448276 1.336117 11.147484 1 252.630000 
9 14 0 2.0 27 0.07407407 1.847756 7.445060 2 1.864342 
10 16 20 2.5 57 0.24561404 1.582308 8.425177 2 9.490196 
11 17 5 3.0 54 0.01851852 1.348305 9.315008 2 15.960000 
12 18 0 1.5 5 1.00000000 1.643657 8.063648 2 6.526300 
13 21 0 2.0 18 0.05555556 1.394964 8.752185 2 37.576955 
14 22 20 2.0 48 0.16666667 1.617045 8.911028 1 11.592383 
15 25 0 2.5 71 0.42253521 1.749114 7.271499 2 6.572772 
16 26 0 2.0 50 0.30000000 1.464582 7.349908 2 9.849276 
17 27 5 2.5 61 0.34426229 1.511217 8.379012 2 14.082827 
18 28 5 2.0 123 0.06504065 1.538188 8.271017 2 11.658142 
19 29 100 3.0 75 0.44000000 1.896483 7.968603 1 9.071897 
20 30 100 3.0 95 0.55789474 1.768147 8.367626 1 2.300783 
21 32 0 3.0 74 0.45945946 1.458793 9.453464 2 57.210000 
22 33 15 3.0 66 0.24242424 1.572704 7.620507 1 8.700000 
23 34 5 3.0 83 0.38554217 1.436063 11.636262 1 50.613265 
24 35 5 2.5 58 0.31034483 1.313440 9.370347 2 52.605041 
25 36 20 2.5 91 0.28571429 1.544032 8.451961 1 9.713351 
26 37 10 2.5 34 0.23529412 1.524725 9.348687 2 6.920026 
27 38 20 2.5 48 0.41666667 1.584892 7.780915 1 11.302639 
28 39 40 2.5 51 0.15686274 1.535552 6.994035 1 18.999423 
29 40 35 2.5 48 0.45833333 1.460579 9.073331 1 12.869075 
30 41 5 3.0 58 0.43103448 1.747669 7.628542 2 3.860225 
31 42 25 2.5 36 0.52777778 

我已經這樣做了,這是第一個兩軸輸出:

y<-rda(nestendca2) 
summary(y) 
       PC1  PC2  
Waterpeil  13.816422 -2.312641 
hoogte_max  0.094747 -0.014497 
Som   2.955029 10.812549 
Leeftijd_riet 0.016476 0.019629 
PFD   0.007361 -0.003386 
oppervlakte 0.052943 0.039657 

現在我想在邏輯迴歸中實現這兩個軸,將它與在這些領域繁殖的猛禽的繁殖成功聯繫起來。

我該怎麼做?

+1

請讓您的情況具有可重複性,即爲我們提供模擬您的情況所需的數據和代碼。有關如何執行此操作的更多提示,請參閱http://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example。 – 2013-03-28 11:23:55

回答

5

如果使用princomp包,你可以提取的負載是這樣的:

PCA <- princomp(data,cor=T) 
PCA 
PCA$loadings 
Loadings <- as.data.frame(PCA$loadings[,1:2]) 

如果使用prcomp你可以這樣做:

PCA2 <- prcomp(data) 
Loadings <- as.data.frame(PCA2$rotation[,1:2]) 

如果使用純素食者:

PCA3 <- rda(data) 
Loadings <- as.data.frame(PCA3$CA$v.eig[,1:2]) 
+0

我編輯了我的問題並添加了一部分數據。我正在使用純素食包,我忘了提及這一點。 – Koentjes 2013-03-28 12:46:49

+0

我將它添加到答案中。 – JT85 2013-03-28 13:29:39

4

假設你在R中使用prcomp這裏有一種方法可以做到這一點

pca <- prcomp(~ Murder + Rape + Assault, data = USArrests, scale = TRUE) 

(loadings <- pca$rotation) 

##    PC1  PC2  PC3 
## Murder -0.58260 0.53395 -0.61276 
## Rape -0.53938 -0.81798 -0.19994 
## Assault -0.60798 0.21402 0.76456 

axes <- predict(pca, newdata = USArrests) 
head(axes, 4) 

##    PC1  PC2  PC3 
## Alabama -1.19803 0.83381 -0.162178 
## Alaska -2.30875 -1.52396 0.038336 
## Arizona -1.50333 -0.49830 0.878223 
## Arkansas -0.17599 0.32473 0.071112 

如果願意,現在可以在邏輯迴歸中使用這些新列(軸)。我會用一個簡單的線性模型向你展示一個例子。

dat <- cbind(USArrests, axes) 
lm(UrbanPop ~ PC1 + PC2, data = dat) 

## Call: 
## lm(formula = UrbanPop ~ PC1 + PC2, data = dat) 

## Coefficients: 
## (Intercept)   PC1   PC2 
##  65.54  -2.58  -7.71 
+0

你好。謝謝您的回答。我正在使用「純素食」包,但是在用我的PC加載器創建數據框後 – Koentjes 2013-03-28 15:05:48

+0

@dickoa爲什麼你使用預測?不會像上面那樣提取加載< - as.data.frame(PCA2 $ rotation [,1:2])的加載足以進行迴歸? – user3495945 2016-03-14 05:36:00