頻率表來計算和排序數組中包含的元素的總和

我有一個表列出了參與者，他們在手機上使用的應用程序以及每個會話的持續時間。它看起來像這樣：頻率表來計算和排序數組中包含的元素的總和

panelist_id      app_name duration 
1  550302      Messages 10 secs 
3  550302       Google 2 secs 
5  550302 com.google.android.partnersetup 20 secs 
7  550302       Google 8 secs 
9  550302       Google 30 secs 
11  550302       Dialer 8 secs

我想製表上述檢查由參與者花了一個應用程序總時間。所以希望它應該是這樣的：

    55302 550303 55304       
1  Messages 1040 1000 458      
3  Google 900 580 345      
5  Dialer 800 150 340 
7  Facebook 513 1549 418

的應用程序的數量超過5000個，並有100個用戶，以便手動插入列和行的名稱是不是一種選擇。

我試圖通過建立一個頻率表來實現這一點，但它並沒有讓我走得很遠。

這是我第一次發佈一個問題，如此道歉的任何錯誤，並提前致謝！

來源

2016-07-14 Aris

你建議的另一個問題是非常相似的，但確實沒有提供關於如何通過兩個不同的變量進行排序的任何信息。使用相同的代碼，我得到一個「參數必須具有相同長度」的問題。 – Aris

使用dplyr你可以寫這樣的事情：

library(dplyr) 
data %>% group_by(app_name, panelist_id) %>% summarize(total_duration = sum(duration))

來源

2016-07-14 13:09:26 dratewka

謝謝！我回來是這樣的： APP_NAME panelist_id total_duration 1 #SquareDroid \\ u2014尺寸相片598136 18秒洪流® - BT下載590543 1372秒在當前然而，我得到了應用程序和小組成員的重複條目，因此很難在之後進行分析。希望以後我可以將它解壓縮爲csv進行分析。 – Aris

頻率表來計算和排序數組中包含的元素的總和

回答

相關問題