0
dput(d)
structure(list(TimeStamp = structure(c(1459569739, 1459569739,
1459569739, 1459569739, 1459569739, 1459569739), class = c("POSIXct",
"POSIXt"), tzone = ""), Status = structure(c(1L, 2L, 1L, 1L,
1L, 1L), .Label = c("get", "send"), class = "factor")), .Names = c("TimeStamp",
"Status"), row.names = c(NA, 6L), class = "data.frame")
這是大數據集的一個子集。我需要每5分鐘計算一次狀態欄。狀態可以發送或獲取。我需要每5分鐘計算一次狀態。您如何總結每5分鐘數據幀中的因素
我已經試過這樣的事情:
agg<- aggregate(data["Status"], list(fiveMin=cut(data$TimeStamp, "5 mins")),sum)
它抱怨不能夠指望的因素。有沒有其他方法?
怎麼樣你打算總結諸如「獲取」和「發送」的值? 「獲得」+「發送」多少錢?試試'aggregate(d [「Status」],list(fiveMin = cut(d $ TimeStamp,「5 mins」)),length)'也許 –
@DavidArenburg,我需要計算得到併發送不同 – user1471980
試試'library data.table); dcast(setDT(d),cut(TimeStamp,「5分鐘」)〜狀態,長度)' –