我無法準備使用dplyr
根據下面的數據集的彙總表使用N():同時作爲計算其他彙總統計
set.seed(1)
df <- data.frame(rep(sample(c(2012,2016),10, replace = T)),
sample(c('Treat','Control'),10,replace = T),
runif(10,0,1),
runif(10,0,1),
runif(10,0,1))
colnames(df) <- c('Year','Group','V1','V2','V3')
我要計算的平均數,中位數,標準偏差,並計算每個組合Year
和Group
的觀測值數量。
我已經成功地使用此代碼來獲得mean
,median
和sd
:
summary.table = df %>%
group_by(Year, Group) %>%
summarise_all(funs(n(), sd, median, mean))
不過,我不知道如何引進funs()
命令裏面的n()
功能。它給了我的計數爲V1
,V2
和V3
。這是相當多餘的,因爲我只想要樣本的大小。我曾嘗試之前和group_by()
行後引入
mutate(N = n()) %>%
,但它並沒有給我我想要的東西。
任何幫助?
編輯:我沒有讓我的疑問很清楚。問題是代碼給了我不需要的列,因爲V1
的觀察次數對我來說已經足夠了。
你可以添加''''()'''''''n''''使代碼可行?像這樣:''''summarise_all(funs(n(),sd,median,mean))''' – raymkchow
檢查https://stackoverflow.com/questions/22801153/dplyr-error-in-n-function-不應該被稱爲 - 直接看看是否有幫助 – Kevin
@raymkchow我編輯了這個問題。現在很清楚。 –