我想使用dplyr
來計算均值,中位數和其他一些內容。因爲我剛剛看了一些介紹(大多比較舊的),我想知道以下是可能的:在列和rbind上執行多個操作
iris %>% group_by_("Species") %>%
summarise_at(.vars = vars(starts_with("Sepal")), .funs=perform_some_operation)
# A tibble: 6 x 4
Species Sepal.Length Sepal.Width Operation
<fctr> <dbl> <dbl> <fctr>
1 setosa 5.006 3.428 mean
2 versicolor 5.936 2.770 mean
3 virginica 6.588 2.974 mean
4 setosa 5.0 3.4 median
5 versicolor 5.9 2.8 median
6 virginica 6.5 3.0 median
的Operation
-column只是增加了清晰度。我不是絕對需要它。
我能找到的唯一的東西是summarise_at(.vars = vars(starts_with("Sepal")), .funs = c(Mean="mean", Median="median"))
。然而,這首先是緩慢的,其次是在列中創建額外的輸出 - 而不是行。
編輯:我不需要產生結果的操作,在summarise_at
之內。
你想要的這裏,我會假設你說的是什麼,你想要什麼還不清楚。操作欄的要點是什麼?除了按物種分組以外,您是否只希望將平均值或中位數應用於每列的某個部分?或者,您是否只想將平均值應用到Sepal.Length和中值到Sepal.width? – user2738526
正如我在代碼下面寫的。操作專欄是爲了澄清前三行是物種的手段。我希望將均值和中位數應用於所有使用「Sepal」的列。 – 5th