我正在嘗試爲相機陷印調查生成物種飽和度曲線。我有成千上萬的觀察結果,並在dplyr中完成大部分操作。使用dplyr總結不同因素的運行總數
我有三個野外地點,觀察記錄了幾個星期捕獲的不同動物物種。在幾周內沒有動物,在其他幾周內可能有不止一種動物。我想爲每個網站生成一個單獨的數字,以比較在連續幾周的研究中遇到的新物種的速度。一旦物種多樣性在該地區被捕獲,這些對新物種的觀察應該最終飽和。一些現場網站可能會比其他網站飽和得更快。
問題是,我還沒有遇到一種方法來計算不同物種的數量,以提供一個按時間運行的總數。下面是一個簡單的虛擬數據集。
field_site<-c(rep("A",4),rep("B",4),rep("C",4))
week<-c(1,2,2,3,2,3,4,4,1,2,3,4)
animal<-c("dog","dog","cat","rabbit","dog","dog","dog","rabbit","cat","cat","rabbit","dog")
df<-as.data.frame(cbind(field_site,week,animal),head=TRUE)
我可以很容易地生成每週分組內的獨特物種的數量,例如,
tbl_df(df)%>%
group_by(field_site,week) %>%
summarise(no_of_sp=n_distinct(animal))
但是這對一些物種在接下來的幾周再次遇到的事實並不敏感。假設數據是從調查開始的時間增加來排序的,我真正需要的是不同物種的數量,這些物種從第1周開始逐行排列每個地點的獨特物種。
在場地A的例子中,在周的研究過程中遇到的物種累積總數爲:第1周= 1種,第2周= 2種,第3周= 3種,第4周=靜止3種。
對於站點B累計總物種的將是:周1 = 0物種,每週2 = 1種,每週3 = 1種,第4周= 1種,等...
任何意見將是不勝感激。 提前歡呼!
是不是站點B第4周= 2種,「狗」和「兔子」? – r2evans