我有一項任務可以對時間序列數據進行異常檢測。我有異常檢測的代碼,但我正在爲它準備數據。數據如下所示。爲異常檢測準備數據
timestampUtc
2016-08-01 14:38:01, 2016-08-01 14:38:06, 2016-08-01 14:38:12, 2016-08-01 14:38:18, 2016-08-01 14:38:22, 2016-08-01 14:38:27, 2016-08-01 14:38:27, 2016-08-01 14:38:30, 2016-08-01 14:38:37, 2016-08-01 14:38:38, 2016-08-01 14:38:38, 2016-08-01 14:38:46, 2016-08-01 14:39:03, 2016-08-01 14:39:03, 2016-08-01 14:39:10, 2016-08-01 14:39:12, 2016-08-01 14:39:15, 2016-08-01 14:39:16, 2016-08-01 14:39:20, 2016-08-01 14:39:28
首先我想在timestampUtc
列中做秒零。接下來,我想創建一個表示count
的列,並希望計算該特定分鐘的值的數量。例如,輸出應該是這樣的:
timestampUtc count
2016-08-01 14:38:00 12, 2016-08-01 14:39:00 6, 2016-08-01 14:40:00 8
我想你可以避免總結一堆,如果你只是使用:'df < - 聚合(計數〜時間戳,數據= df,樂趣=長度)' –