0
我試圖將數據集的特定列與不同設備的日常數據樣本轉換爲按兩個鍵(小時和因子1)分組的時間序列列表在data.table組中的ts函數中定義開始和結束
我的數據是這樣的
date hour factor1 volume wkday
1: 2015-10-01 AM 11011 530 Thursday
2: 2015-10-01 AM 11012 1535 Thursday
3: 2015-10-01 AM 11021 191 Thursday
4: 2015-10-01 AM 11131 1108 Thursday
5: 2015-10-01 AM 11132 1518 Thursday
6: 2015-10-01 AM 11141 508 Thursday
日期運行從2015年10月1日至2017年8月1日,時有兩個級別(AM和PM),因子1具有多層次,wkday是目前不需要。我想變成時間序列數據的列是音量。
我試着這樣做:
table_11011 = table[factor1 == '11011']
table_11011_am = table_11011[hour == 'AM']
table_11011_am[, vol_ts := ts(table_11011_am[,volume],
start = decimal_date(table_11011_am[, date][1]),
frequency = 365)]
因此我得到需要的結果,但是當我試着總結一下本作所有的不同因子1水平和小時,我不知道如何輸入正確的開始和結束日期。到目前爲止,我設法做到了這一點,但它似乎輸出了一個糟糕的結果。
table[, vol_ts := ts(volume,
start = decimal_date(table[, date][1]), frequency = 365), by = c('factor1', 'hour')]
任何幫助,將不勝感激!
這不是我正在尋找的答案,但它非常有幫助。我正在尋找的是在同一個數據框中,以某種方式定義新列上的ts,但每個ts是不同的,因爲每個factor1和hour可以有不同的長度......我不知道我是否在'解釋我自己。無論如何,非常感謝你的幫助。 –