我是R新手,根據StackOverflow上的其他有用建議將以下語法拼湊在一起。我試圖總結名爲「COMBINED HOURS」的列,並獲得按列DOC_NUM分組的名爲DOC_LINE_NUM的列的COUNT。ddply colSums和列的數量在一起
因此,對於每個DOC_NUM,計算總和COMBINED_HOURS,並顯示COUNT個DOC_LINE_NUM。
下面的語法可以正常工作以獲得COMBINED_HOURS的列總和,但是如何將COUNT邏輯合併到DOC_LINE_NUM的此語法中?
謝謝。
train2 <- ddply(train, c("WEEKNUM", "DOC_NUM", "DOC_LINE_NUM", "SHORT_DATE","CUST_CODE", "OP_CODE", "JOB_TP_CODE"), function(x) colSums(x[c("COMBINED_HOURS")]))
# Sample data
WEEKNUM DOC_NUM DOC_LINE_NUM SHORT_DATE CUST_CODE OP_CODE JOB_TP_CODE COMBINED_HOURS
40 227555 1 2015-10-02 DOTSUG NDONA PU 0.0269448
40 227555 3 2015-10-02 DOTSUG NDONA PU 0.4183320
「老派」工作很好!謝謝格里高爾。我也會按照建議刷新新的dplyr。 – user5509057