我已經玩了dplyr
一點,真的很喜歡它。我雖然失去了一些東西。在plyr
中,我能夠將一個函數傳遞給ddply
並重用它。dplyr和可重複使用的參數列表
library('dplyr')
library('plyr')
fn = function(df) {
summarise(df,
count = length(id))
}
ddply(DF1,'group', fn)
ddply(DF2,'group', fn)
所以我能將錄音多個數據集的一個長長的清單,而不復制所有的參數summarise
。在dplyr
,但是,我必須這樣做
dplyr::summarise(group_by(DF1,group),
count = length(id))
dplyr::summarise(group_by(DF2,group),
count = length(id))
所以參數summarise
每次都重複。 list('.data'=DF1,'count'=length(id))
和do.call
參數列表不起作用,因爲length(id)
在我定義參數列表時進行評估。有沒有解決方案?
爲什麼你有很多小數據框而不是一個大數據框? – hadley