2016-06-28 24 views
-1

假設我們有具有以下結構的數據表:R:查找長度匹配和集合值

http://pastebin.com/7Nj0ix75

time_daysdeadline_sub_launched手動通過Excel中插入計算的天數爲每個項目。注意:原始列表更長,項目持續時間更多。

我想要做的是找到所有具有相同運行時間的項目並聚合它們的行值。所以$運行與5天應進行彙總所有項目,$運行所有項目用3天應進行彙總等

項目,長度5應該是

runs.l5 
113 (sum of row1 of projects length 5) 
210 (sum of row2 of projects length 5) 
178 (sum of row3 of projects length 5) 
129 (sum of row4 of projects length 5) 
197 (sum of row5 of projects length 5) 

這也將是不錯的 - 因爲控制 - 有一個額外的列表,顯示哪些項目排序到哪個#日期桶。

感謝您的幫助!

回答

0

使用dplyr包,我們可以這樣做:

df %>% group_by(time_days) %>% 
    summarize(total_runs = sum(runs)) 

這應該給你一個在天各子組持續時間的總運行。您也可以在彙總功能的其他列上執行操作,但這取決於您想要如何彙總開始/結束日期和截止日期。

+0

我想我在解釋中犯了一個錯誤。我希望查看每個持續5天的項目的day1,day2,day3,day4的總值。總的來說,我不想總結所有項目的所有行。 – JohnnyDeer