2013-05-27 32 views
7

我有以下數據幀(DF1):R-摺疊的行和列中的值相加

ID someText PSM OtherValues 
ABC c 2 qwe 
CCC v 3 wer 
DDD b 56 ert 
EEE m 78 yu 
FFF sw 1 io 
GGG e 90 gv 
CCC r 34 scf 
CCC t 21 fvb 
KOO y 45 hffd 
EEE u 2 asd 
LLL i 4 dlm 
ZZZ i 8 zzas 

我想摺疊第一列和添加相應的PSM值 和我想獲得以下輸出:

ID Sum PSM 
ABC 2 
CCC 58 
DDD 56 
EEE 80 
FFF 1 
GGG 90 
KOO 45 
LLL 4 
ZZZ 8 

看來可以使用聚合函數但不知道語法。 任何幫助真的很感激!謝謝。

回答

16

在基地:

aggregate(PSM ~ ID, data=x, FUN=sum) 
## ID PSM 
## 1 ABC 2 
## 2 CCC 58 
## 3 DDD 56 
## 4 EEE 80 
## 5 FFF 1 
## 6 GGG 90 
## 7 KOO 45 
## 8 LLL 4 
## 9 ZZZ 8 
2

這是超級容易使用plyr包:

library(plyr) 
ddply(df1, .(ID), summarize, Sum=sum(PSM)) 
1

例使用dplyr,plyr的下一個迭代:

df2 <- df1 %>% group_by(ID) %>% 
    summarize(Sum_PSM = sum(PSM)) 

當你把字符%>%,你是「管道」。這意味着您要輸入管道操作員左側的內容並執行右側的功能。