如何確定CCA有多少變量太多？

我正在運行一些生態數據的CCA，約有50個站點和幾百個物種。我知道當你的解釋變量數量接近你的樣本數量時你必須小心。我有23個解釋變量，所以這對我來說不是問題，但我也聽說使用太多的解釋變量可以開始「解除」CCA。如何確定CCA有多少變量太多？

是否有任何關於多少解釋變量合適的指導原則？到目前爲止，我只是將它們全部繪製出來，然後刪除了那些似乎是多餘的東西（留下了8個）。我可以使用這些慣性值來幫助通知/證明這一點嗎？

謝謝

來源

2017-01-12 setbackademic

這與問「有多少變量對於迴歸分析太多？」是一樣的問題。不是「幾乎相同」，但完全一樣：CCA是線性迴歸擬合值的排序。在最嚴重的情況下，你可能會過度適應。在CCA中，當CCA和（無約束）CA的第一特徵值幾乎相同並且第一維中的座標看起來相似時（您可以使用Procrustes分析來檢查該特徵值），這是顯而易見的。極端的情況是剩餘變差消失，但在協調中，你關注的是第一維，並且那裏的約束可能比後來的約束軸或殘差早得多。更重要的是：你必須將CCA看作是一種迴歸分析，並且對迴歸中的解釋性（獨立）變量具有與約束相同的態度。如果你沒有先前的研究假設，你就會遇到迴歸分析的模型選擇以及多變量排序問題的所有問題，但這些都是非技術性問題，應該在其他地方處理，而不是在計算器中處理。

來源

2017-01-12 08:08:19

對樣本量的小小評論：您的樣本量約爲50個觀察值 - 物種數量無關緊要。對於50個觀測值的樣本，您是否適合具有23個解釋變量的迴歸？幾乎不。你是否適合具有8個解釋變量的迴歸到50分。我不知道，但你不應該。當你考慮你需要的約束數時，可以用這些術語來思考。 –

如何確定CCA有多少變量太多？

回答

相關問題