-2
我有含5列器R並聯執行
COL1 | COL2 | COL 3 | COL 4 | COL 5
我需要聚合在COL1和COL2應用4個不同的函數來COL5列的數據幀
a1<-aggregate(COL2 ~ COL1, data = dataframe, sum)
a2<-aggregate(COL3 ~ COL1, data = dataframe, length)
a3<-aggregate(COL4 ~ COL1, data = dataframe, max)
a4<-aggregate(COL5 ~ COL1, data = dataframe, min)
finalDF<- Reduce(function(x, y) merge(x, y, all=TRUE), list(a1,a2,a3,a4))
1)I有24個核心上機器。 如何並行執行4行代碼(a1,a2,a3,a4)? 我想同時使用4個內核,然後使用減少計算finalDF
2)我可以使用不同的列不同的功能在一個聚合 (我可以在多個列中使用一個樂趣,我還可以在使用多個功能但是我無法在不同列上應用多個功能[COL2-sum,COL3-length,COL4-max,COL5-min])
如果'聚合'速度太慢,你應該使用data.table或dplyr來代替。速度增益預計會比因子4好得多。 – Roland
請提供一個可重現的示例,並說明數據的維度,以及您在真實數據集中唯一組的總數。如果您可以提供代碼來生成代表您的真實數據集的樣本數據,那更好。 – Arun