R素食物種分數與物種與軸的引物Spearman等級相關性有何區別？

在約束排序分析中，如CAP或dbRDA，研究人員通常想知道多少不相似性歸因於特定物種。在Primer PERMANOVA,Spearman rank或Pearson correlations物種的軸是一個選項，提供了物種組合之間的差異，使用CAP或RDA時物種組合之間的差異的估計。在R中，vegan提供了不同的度量，稱爲物種分數，其可以被計算爲但是沒有仔細考慮潛在的缺點https://github.com/vegandevs/vegan/issues/254#issuecomment-334071917。和vegan dbrda species scores are empty despite community matrix provided，當使用capscale時。R素食物種分數與物種與軸的引物Spearman等級相關性有何區別？

我想更好地瞭解Primer PERMANOVA中如何計算相關性和物種分數。首先，這些方法旨在展示真正的區別嗎？使用Spearman或Pearson correlations比R-vegan的物種得分有什麼好處和缺點？在Primer中計算物種間軸相關性的方法是否遇到類似的問題，如上面關於R中物種分數capscale或dbrda中詳細描述的問題？在入門書中，從社區矩陣和軸中使用的變量是什麼來計算它們之間的相關性？這些原始數據還是轉換後的數據？最後，如果相關方法能更好地估計組合間物種間的差異比R中的物種得分更高的估計值，那麼這是否應該被視爲R素食者物種得分的替代？

來源

2017-10-04 Philip Haupt

**如果**你在這裏沒有得到一個答案在合理的時間後，你可以嘗試張貼（與這個問題的鏈接）到'r-sig-ecology @ r-project.org' ... –

我想評論，但是編寫回復需要很長時間......這需要很長的評論。 –

從https://github.com/vegandevs/vegan/issues/254最近的反饋我知道有一些潛在的缺陷和使用物種軸相關性的嚴重併發症 - 因此，爲什麼這不被用於R' vegan'。這聽起來好像排序相關性會受到非排列空間中的非歐幾里得距離所強加的相同複雜性的影響，詳細情況詳見https://stackoverflow.com/questions/46531969/vegan-dbrda-species-scores-are-empty-despite-社區矩陣 - 爲「dbrda」純素物種分數提供。期待PRIMER用戶對相關性的反饋。 –

我從來沒有見過底漆和素食主義者和底漆之間我不能評論的差異，但我可以解釋我們是如何在素食主義者工作。

如果考慮擬合環境變量的物種分數爲箭頭，則有兩個不同的方面：方向和長度。首先關於箭頭的方向。

一般來說，箭頭不平行於軸線，但它們指向物種或環境變量最快速變化的方向。箭頭的方向可以從線性模型lm(y ~ Ax1 + Ax2)中找到。如果y是一個物種，這給出了物種得分的箭頭，並且如果y是一個環境變量，這給出了一個擬合向量。物種與軸相關意味着兩個獨立的模型lm(y ~ Ax1)和lm(y ~ Ax2)。 素食主義者模型定義了一個線性趨勢面，並且該軸模型定義了兩個單獨的線性趨勢面，每個線性趨勢面沿着一個軸具有最陡的梯度。下面的示例示出了線性模型如何與在PCA物種的分數在素食主義者：

library(vegan) 
data(varespec) 
pc <- rda(varespec) 
biplot(pc) # species scores as biplot arrows 
plot(envfit(pc ~ Pleuschr + Cladarbu + Cladrang + Cladstel, varespec)) 
ordisurf(pc ~ Cladstel, varespec, knots = 1, add = TRUE)

的envfit函數將指向相同的方向物種的分數箭頭和ordisurf增加線性（knots = 1）趨勢面到Cladstel。線性趨勢面的等值線等距並垂直於箭頭。向箭頭投射取樣單位給出了這個二維解中預測的物種丰度。在RDA中物種分數的解釋是相似的，但在那裏你必須記得使用線性組合分數（display="lc"），而在CCA中，你必須記得使用加權迴歸（envfit和ordisurf自動處理，但與lm或其他非 - 素食主義者您需要明確權重的工具）。

這種方法不容易改變使用秩相關。對於等級，您需要將點（抽樣單位）投影到單變量序列。人們通常在軸上投影（也就是說，他們將軸與物種相關聯）。然而，如果我們找到一條通過原點的線，那麼當採樣單元投影到其上時（如果存在唯一的線或包含線的線段），就會得到最佳的相關性。這與我們尋找線性趨勢面最陡變化方向的方法類似。這很容易用歐幾里德空間完成，就像所有的素食主義者排序空間一樣，但與預測排名不同。

線性趨勢面的假設非常簡單。它是PCA和RDA中物種的模型，它是RDA約束的模型，它顯示了分析如何看待您的數據（請記住"lc"得分！）。但是，對於其他變量和其他排序方法，更復雜的響應模型通常更加適用。這些可以通過使用ordisurf與knots> 1來擬合。

然後關於箭頭的長度或物種得分距離原點的距離。 envfit()函數找到正確的方向，但它通過相關係數縮放箭頭長度。在PCA和RDA中，我們有幾種可選的縮放選項：請參閱?scores.cca中的scaling和correlation的詳細說明。默認（correlation = FALSE）縮放使得箭頭與物種丰度的絕對變化成比例。也就是說，豐富的物種可以改變很多，可以有長箭頭，但稀有物種只能改變一點，總是有短箭頭。這是絕對的變化，而不是相對的變化。使用correlation = TRUE時，箭頭長度與相對變化成正比，並且將與envfit中使用的相關性的縮放類似。再次，研究手冊的細節（?scores.cca）。

來源

2017-10-05 08:01:23

請參考下面從馬丁·安德森響應與上面這個問題的電子郵件中的非常有用的回覆 - 複製與她的權限：

親愛的菲利普，

感謝您對所有的信息和興趣這些方法及其解釋。我不會評論基於R的東西在素食主義者中的實施，毫無疑問Jari最好能夠做到這一點，但我很樂意評論在PRIMER/PERMANOVA中實現的原始等級（或Perason）相關向量軟件。首先，讓我強調這些是爲了成爲探索性工具。很簡單，他們所做的只是顯示單個物種（或其他變量）與排序軸的原始（或多個）相關性。這裏有兩個重要的注意事項或重要的注意事項。首先，他們最強調的不是直接告訴你任何關於單個物種在駕駛dbRDA（或者nMDS或PCO或者你正在談論的任何排序軸）中看到的模式可能發揮的具體作用。他們不能這樣做，因爲它們是在事實之後被繪製的，而且，正如我們所知，在很多情況下，原始物種變量和排序軸之間的關係根本不是線性的（甚至是單調的）。（通常）在某些選定的不相似度量（如BC或Jaccard等）的空間中進行排序。這適用於很多原因（我相信你已經知道，我不會進去）。要查看dbRDA（或任何其他排序）等受約束的排序空間中單個物種的模式，我建議您使用泡泡圖，這是一個更加精細的工具，用於可視化圖案。（順便說一下，在PRIMER 7中，可以通過疊加分割的泡泡圖來以這種方式同時對一組物種的圖案進行可視化。泡泡圖的優勢在於，對於任何給定的物種，它們能夠顯示任何可能的圖案包括跨組的階躍變化，跨因子的潛在相互作用，沿梯度的單峯或多峯模式等。現在，使用rank（或Pearson）相關矢量具有能夠一次繪製大量物種的優點，但它們顯然是一種比較鈍的工具，因爲它們只能很好地展示那些可能與排序軸有增加或減少關係的物種，如果這些物種往往不是整個故事，但它們的用途，特別是在CAP設置，其中軸被特別繪製以最大化羣組差異，在這種情況下，羣組在該圖上是分開的，因此具有較長軸的物種在這些圖中增加或減少通常對應那些表徵羣體差異的物種。然而，即使在CAP的例子中，有時候，羣體差異是由多組同時作用在一起的多個（次要）物種的成分變化以及通過相異性度量同時引起的，並且這可能不容易被任何單一模式拾取這些物種當被獨立和單獨考慮時。

嗯，我希望我已經幫助澄清了這裏的一些問題。以上所有的結論是，把這些向量放到你可能選擇的任何排序圖上是沒有問題的，但它們是一種啓發式和後向運動，而不是基於不同類型設置的確定性或診斷工具，他們只表現出某種關係。其他工具（例如泡沫或分段泡泡圖）在其關於單個物種模式的信息內容中將更豐富。

我希望以上內容對您有所幫助！親切的問候，馬蒂安德森

來源

2017-10-07 11:52:17

R素食物種分數與物種與軸的引物Spearman等級相關性有何區別？

回答

相關問題