2016-09-25 59 views
0

我有一個.csv 1,052,640行。每一行是2年(2014年7月1日至2016年6月30日)一分鐘時間序列分析:如何在R中創建幀

基於R 1分鐘間隔內的活性的讀數,我輸入該數據到像這樣一個數據幀:

uri = 'summary.csv' 
df.visits <- read.csv(uri, header=FALSE) 
names(df.visits) <- c("DateTime", "Visits") 
df.visits <- data.frame(df.visits) 
head(df.visits) 

與輸出

   DateTime Visits 
1 7/1/2014 12:00:00 AM  0 
2 7/1/2014 12:01:00 AM  0 
3 7/1/2014 12:02:00 AM  0 

我想那個數據幀推到一個時間序列的結構是這樣的:

ts.visits <- ts(df.visits,frequency=525960, start=c(2014,7,1)) 
head(ts.visits) 

和輸出是:

DateTime Visits 
[1,] 788041  0 
[2,] 788043  0 
[3,] 788045  0 
[4,] 788047  0 

我的問題 - 是525960正確的值用於頻率?如果有閏年會發生什麼?日期時間值('788041')是否正確?我想根據一天中的時間,一週中的某一天和一年中的月份進行季節性分析。

回答

1

在R中,ts對象用於固定季節期的時間序列。如果你想考慮一個事實,即由於閏年在一年內有不同的秒數,你必須使用別的東西。包裝xts是任意觀察時間的替代方案。

此外,在您的TS列的DateTime對象(實際上,MTS)不是倍對象內部使用。他們被視爲另一個時間序列的觀察。實際時間可以通過時間獲得(ts.visits)。