2016-07-14 85 views
0

我有一個表列出了參與者,他們在手機上使用的應用程序以及每個會話的持續時間。它看起來像這樣:頻率表來計算和排序數組中包含的元素的總和

panelist_id      app_name duration 
1  550302      Messages 10 secs 
3  550302       Google 2 secs 
5  550302 com.google.android.partnersetup 20 secs 
7  550302       Google 8 secs 
9  550302       Google 30 secs 
11  550302       Dialer 8 secs 

我想製表上述檢查由參與者花了一個應用程序總時間。所以希望它應該是這樣的:

    55302 550303 55304       
1  Messages 1040 1000 458      
3  Google 900 580 345      
5  Dialer 800 150 340 
7  Facebook 513 1549 418     

的應用程序的數量超過5000個,並有100個用戶,以便手動插入列和行的名稱是不是一種選擇。

我試圖通過建立一個頻率表來實現這一點,但它並沒有讓我走得很遠。

這是我第一次發佈一個問題,如此道歉的任何錯誤,並提前致謝!

+0

你建議的另一個問題是非常相似的,但確實沒有提供關於如何通過兩個不同的變量進行排序的任何信息。使用相同的代碼,我得到一個「參數必須具有相同長度」的問題。 – Aris

回答

0

使用dplyr你可以寫這樣的事情:

library(dplyr) 
data %>% group_by(app_name, panelist_id) %>% summarize(total_duration = sum(duration)) 
+0

謝謝!我回來是這樣的: APP_NAME panelist_id total_duration 1 #SquareDroid \\ u2014尺寸相片598136 18秒洪流® - BT下載590543 1372秒 在當前然而,我得到了應用程序和小組成員的重複條目,因此很難在之後進行分析。希望以後我可以將它解壓縮爲csv進行分析。 – Aris

相關問題