這裏是什麼我的數據集看起來像一個簡化版本:[R編程:如何找到在每兩個連續的日期值的差異,給出了具體的ID
> df
ID total_sleep sleep_end_date
1 1 9 2017-09-03
2 1 8 2017-09-04
3 1 7 2017-09-05
4 1 10 2017-09-06
5 1 11 2017-09-07
6 2 5 2017-09-03
7 2 12 2017-09-04
8 2 4 2017-09-05
9 2 3 2017-09-06
10 2 6 2017-09-07
凡total_sleep以小時爲單位表示。
我正在試圖找到的是在給定特定用戶ID的情況下,每兩個連續日期的睡眠小時數的絕對差異。所需的輸出應該是這個樣子:
> df_answer
ID total_sleep sleep_end_date diff_hours_of_sleep
1 1 9 2017-09-03 NA
2 1 8 2017-09-04 1
3 1 7 2017-09-05 1
4 1 10 2017-09-06 3
5 1 11 2017-09-07 1
6 2 5 2017-09-03 NA
7 2 12 2017-09-04 7
8 2 4 2017-09-05 8
9 2 3 2017-09-06 1
10 2 6 2017-09-08 NA
NA出現在行1和6,因爲它沒有關於前一天的任何數據。
最重要的是,NA出現在第10行,因爲我沒有關於前一天(2017-09-07)的任何數據。這是我編寫代碼最棘手的部分。
我已經Google(意思是:「stackoverflowed」)這並試圖找到一個解決方案使用「數據爭奪cheatsheet」爲dplyr,但我一直沒能找到一個函數,使我能夠做什麼我想要考慮這兩個變量:日期和不同的用戶ID。
我是R的初學者,所以我可能確實缺少一些簡單的東西。任何意見或建議將非常受歡迎!
編輯該問題! –