我可以聚合data.frame
平凡與dplyr
具有以下:R:聚合由所有因子水平(存在並且不存在)
z <- data.frame(a = rnorm(20), b = rep(letters[1:4], each = 5))
library(dplyr)
z %>%
group_by(b) %>%
summarise(out = n())
Source: local data frame [4 x 2]
b out
(fctr) (int)
1 a 5
2 b 5
3 c 5
4 d 5
但是,有時數據集可能缺少的因素。在這種情況下,我希望輸出爲0
。
例如,假設典型數據集應該有5個組。
z$b <- factor(z$b, levels = letters[1:5])
但顯然沒有任何在這個特殊,但可能是另一個。我怎樣才能彙總這個數據,所以length
缺失factors
是0
。
所需的輸出:
Source: local data frame [4 x 2]
b out
(fctr) (int)
1 a 5
2 b 5
3 c 5
4 d 5
5 e 0
你可以用'tapply'這樣'tapply(Z $ B,Z $ B,長度)' – Raad
我覺得這是一個[未決問題在github上](https://github.com/hadley/dplyr/issues/341)。 – JasonAizkalns