比方說,我有一個時間戳數據框和當時銷售的相應門票數量。使用滾動時間間隔來計算R和dplyr中的行
Timestamp ticket_count
(time) (int)
1 2016-01-01 05:30:00 1
2 2016-01-01 05:32:00 1
3 2016-01-01 05:38:00 1
4 2016-01-01 05:46:00 1
5 2016-01-01 05:47:00 1
6 2016-01-01 06:07:00 1
7 2016-01-01 06:13:00 2
8 2016-01-01 06:21:00 1
9 2016-01-01 06:22:00 1
10 2016-01-01 06:25:00 1
我想知道如何計算在所有門票的特定時間範圍內出售的門票數量。例如,我想計算所有票後15分鐘內售出的票數。在這種情況下,第一行將有三張票,第二行將有四張票,等等。
理想情況下,我正在尋找一個dplyr解決方案,因爲我想爲具有group_by()
函數的多個商店。但是,我在確定如何保存每個給定行的Timestamp時遇到一些問題,同時通過dplyr語法搜索所有時間戳。
不完全。這只是第二行的正確答案。每行所需的窗口是不同的。所以對於第一行,我想知道5:30到5:45之間的票數,第二行是5:32和5:47之間的票數,5:38和5之間的第三行:53等,這是否有意義? – dmartin