2017-01-12 19 views
0

我正在運行一些生態數據的CCA,約有50個站點和幾百個物種。我知道當你的解釋變量數量接近你的樣本數量時你必須小心。我有23個解釋變量,所以這對我來說不是問題,但我也聽說使用太多的解釋變量可以開始「解除」CCA。如何確定CCA有多少變量太多?

是否有任何關於多少解釋變量合適的指導原則?到目前爲止,我只是將它們全部繪製出來,然後刪除了那些似乎是多餘的東西(留下了8個)。我可以使用這些慣性值來幫助通知/證明這一點嗎?

謝謝

回答

2

這與問「有多少變量對於迴歸分析太多?」是一樣的問題。不是「幾乎相同」,但完全一樣:CCA是線性迴歸擬合值的排序。在最嚴重的情況下,你可能會過度適應。在CCA中,當CCA和(無約束)CA的第一特徵值幾乎相同並且第一維中的座標看起來相似時(您可以使用Procrustes分析來檢查該特徵值),這是顯而易見的。極端的情況是剩餘變差消失,但在協調中,你關注的是第一維,並且那裏的約束可能比後來的約束軸或殘差早得多。更重要的是:你必須將CCA看作是一種迴歸分析,並且對迴歸中的解釋性(獨立)變量具有與約束相同的態度。如果你沒有先前的研究假設,你就會遇到迴歸分析的模型選擇以及多變量排序問題的所有問題,但這些都是非技術性問題,應該在其他地方處理,而不是在計算器中處理。

+1

對樣本量的小小評論:您的樣本量約爲50個觀察值 - 物種數量無關緊要。對於50個觀測值的樣本,您是否適合具有23個解釋變量的迴歸?幾乎不。你是否適合具有8個解釋變量的迴歸到50分。我不知道,但你不應該。當你考慮你需要的約束數時,可以用這些術語來思考。 –