我有一個獨特的問題,我正在嘗試解決。在列表中分組數據幀
我有一個數據表,其中包含幾個不同類型的信息。 示例波紋管。
ID|inpSeq|Act |User |Representing
--|----- |----|---- |-----
1 | 123 | s | ABC | NA
1 | 124 | s | ABC | NA
1 | 125 | c | ABC | x1
1 | 126 | c | XYZ | x2
1 | 127 | d | ABC | x2
我所試圖做的是組織的數據,以便查看如何「用戶」是指「Repres」
換句話說,我希望建立以下輸出
ID|Act |User|....
--|------|----|----|----
1 | sscd | ABC| x1 | x2.....
1 | c | XYZ| x2.....
因此,您可以看到原始表格被壓縮到「用戶」中心視圖中,而「行爲」現在包含用戶在單個ID上執行的所有活動。
此外,我有一個這個活動進行了整理,我需要(動態地,如果不同)顯示誰代表他們執行活動。這表示爲x1,x2 ......這意味着這可以增長,這取決於每個ID /動作/用戶組合對於唯一的「代表」各方的可能性如何。
需要注意的重要一點是Act字段中的「s」值在代表字段中始終爲NA。所以在那些NA中不需要包含在轉換後的視圖中。
現在爲止我能得到的代碼ID|Act|User
部分想通了,通過使用下面的代碼
aggregate(Act~ID+User, paste, collapse="", data=df)
但我需要弄清楚如何做休息。那是我需要你所有幫助的地方。
P.S. 「inpSeq」字段是由外部應用程序按順序創建的唯一數字字段,它允許按正確的順序排列活動。
你可能要考慮在'了'nest'功能tidyr'它允許在數據幀的單個細胞值的列表。請參閱:https://blog.rstudio.org/2016/02/02/tidyr-0-4-0/。 –