2
我有一些看起來像這樣的數據。我想通過電子郵件和wk_id分配一個「ID」。根據兩列分配ID R
row_num email wk_id
1 aaaa 1/4/15
2 aaaa 1/11/15
3 aaaa 1/25/15
4 bbbb 6/29/14
5 bbbb 9/7/14
6 cccc 11/16/14
7 cccc 11/30/14
8 cccc 12/7/14
9 cccc 12/14/14
10 cccc 12/21/14
11 cccc 12/28/14
12 cccc 1/4/15
13 cccc 1/25/15
我希望數據看起來像這樣。
row_num email wk_id ID
1 aaaa 1/4/15 1
2 aaaa 1/11/15 2
3 aaaa 1/25/15 3
4 bbbb 6/29/14 1
5 bbbb 9/7/14 2
6 cccc 11/16/14 1
7 cccc 11/30/14 2
8 cccc 12/7/14 3
9 cccc 12/14/14 4
10 cccc 12/21/14 5
11 cccc 12/28/14 6
12 cccc 1/4/15 7
13 cccc 1/25/15 8
我不知道如何讓「計數器」在每次遇到新的電子郵件地址時進行重置。我試過data.table
和ddply
,但仍然無法完全掌握它。
使用哈德利法...分割應用合併。通過電子郵件/ wk_id拆分數據,apply:爲每個塊添加1:nrow(small_chunk)列,然後合併回數據框。 – cory