我有一個時間戳列數據如下動態創建基於唯一列,多個子集值
v1 v2 v3 v4 v5
1 apple 2/20/2015 12:09:19 AM 100 98
2 pear 2/19/2015 12:09:16 AM 98 97
3 apple 2/19/2015 12:09:17 AM NA 80
4 apple 2/17/2015 12:09:11 AM 78 75
5 pear 2/20/2015 12:09:12 AM 50 62
6 cherry 2/21/2015 12:09:13 AM 75 75
7 apple 2/20/2015 12:09:14 AM 75 75
如圖我想,以確定是否發生在每一天每個水果類型的條目。文件大小和水果種類數量都很大。
首先對於每種水果類型,我想要動態地返回子集,例如蘋果
v1 v2 v3 v4 v5
1 apple 2/20/2015 12:09:15 AM 100 98
3 apple 2/19/2015 12:09:15 AM NA 80
4 apple 2/17/2015 12:09:15 AM 78 75
7 apple 2/20/2015 12:09:14 AM 75 75
然後對於每個果型,我要找來算,如果發生在一天中的任何條目(例如,是或否0或1,如下)如對於蘋果
v2 v3 sign
apple 2/17/2015 1
apple 2/18/2015 0
apple 2/19/2015 1
apple 2/20/2015 1
apple 2/20/2015 1
我是r新手,任何指導都有幫助。我目前正在使用獨特的(df $ v2),但在哈希卡或指定命名。
'xtabs'導出來自'stats'命名空間(而不是'dplyr')。 –