從具有時間戳行的數據框(strptime結果),彙總間隔統計信息的最佳方法是什麼?什麼是有效的方法來分區和聚合數據框中時間戳記的行間隔?
間隔可能是一個小時,一天等
還有的aggregate
功能,但不指定每行的間隔幫助。我打算在表示間隔的數據框中添加一列,並將其與aggregate
一起使用,但如果有更好的解決方案,它聽起來會很棒。
感謝您的指點!
示例數據
五行,時間戳分爲起始於03:00 15分鐘的間隔。
間隔1
- 「2010-01-13 3點02分38秒UTC」
- 「2010-01-13 3點08分14秒UTC」
- 「2010年01期-13三時14分52秒UTC」
間隔2
- 「2010-01-13三時20分42秒UTC」
- 「2010-01-13 3時22分十九秒UTC」
結論
使用時間系列包如xts
應該是解決方案;然而,我沒有成功使用它們,並使用cut
纏繞起來。由於我目前只需要繪製直方圖,並按行間隔分組,所以這已足夠。
cut
使用喜歡這樣:
interv <- function(x, start, period, num.intervals) {
return(cut(x, as.POSIXlt(start)+0:num.intervals*period))
}
您可以使用'num.intervals'的默認值作爲'ceiling((max(x)-start)/ period)'。那麼你確定最大的時間戳會在一定的時間間隔內。 – Marek 2010-03-17 15:16:40