2016-04-29 34 views
1

我有一個的大數據幀(300萬+行,14周的cols),顯示在一年346點獨特的緯度和經度如何基於一個唯一的標識符

JULDAY, D0cm, D2.5cm, .... 
1  .84 .76 
1  .83 .78 
2  .20 .23 
2  .19 .19 
... 
365  .026 .076 
365  .025 .053 

JULDAY每小時,每天氣溫總結行365天分成24小時(例如,每行1小時,每天24行)以及相應的溫度值根據深度

我認爲應該有一個簡單的解決方案,但似乎無法弄清楚。

基本上我要總結每天的24個值D0cmD2.5等在JULDAY 所有365個獨特的價值觀這應該給我365值,即每天24小時,值總和

它是一個創建for循環的情況? 我相信有人在那裏可以點我在正確的方向

很抱歉,如果我不解釋自己很好,但我很累......

回答

2

我們可以使用dplyr

library(dplyr) 
df1 %>% 
    group_by(JULDAY) %>% 
    summarise_each(funs(sum = sum(., na.rm=TRUE))) 

或用data.table

library(data.table) 
setDT(df1)[, lapply(.SD, sum, na.rm=TRUE), by = JULDAY] 
+0

真棒,謝謝,我已經全光照(dplyr)soiltemps%>% group_by(JULDAY)%>% summarise_each(SumD0cm = sum(D0cm),SumD2.5cm = sum(D2.5cm))',但第二個data.table的效果好得多。新的這是一個簡單的答案 – Vaughn