我輸入的數據包含主題ID和2個類別的列表,以及實時和兩個值。每個ID的實時和值可能會有不同的長度。文件中有多個ID,每個ID有多個類別。將時間戳格式化爲時間間隔
我遇到了一些麻煩,找到一個很好的工具來做這個改變到數據文件的變化。我正在使用PostgreSQL來提取數據和R進行分析,因爲無法找到幫助的好函數。有什麼想法嗎?我基本上希望將實時時間設置爲30分鐘時間間隔而不是時間戳,並將這些作爲我的屬性,並將V1的值用作實際值。但首先,我必須將時間間隔類別放入我的數據中。
輸入:
ID CAT1 CAT2 realtime V1
21 23 51 11/2/3138 18:29 135
21 23 51 11/2/3138 18:58 132
21 23 51 11/2/3138 21:05 129
21 23 51 11/2/3138 21:05 130
21 23 51 11/2/3138 22:53 142
71 23 52 11/4/3138 6:47 66
71 23 52 11/4/3138 8:45 69
71 23 52 11/4/3138 8:45 68
輸出:
ID || CAT1 || CAT2 || Interval 0 || Interval 1 || Interval 2 || Interval 3 || ...
21 || 21 || 23 || 135 || 132 || 130 || 142 || ...
71 || 23 || 52 || 66 || 69 || 68 || NULL || ...
我也寫了一些有關串聯的數據,這些數據並沒有顯示出是非常有用的,但是如果你不同意,請讓我知道: Perl + PostgreSQL-- Selective Column to Row Transpose
編輯::我會打開使用韋卡或Matlab如果存在 - 或腳本語言來解決這個問題,但我希望有一個函數/ pa ckage在某處...
3138?你確定嗎? –
這是公共健康數據,所以它給了垃圾年。由於我只對時間間隔感興趣,所以我們不需要專注於此。 –