下面,您可以找到時間序列的摘錄。我想切割由空白區分開的行(白色區域是爲了清晰起見,數據中沒有空行)。有一個重複出現的模式,即21次X值,4次不同值ABCD,21次Y值,4次不同值EFGH,21次Z值等。在這種情況下,我有興趣獲得BCDY,FGHZ等。根據不規則圖案切片
問題是這種模式有時會因缺失數據而中斷,使其不規則。結果,我想丟棄的值的數量(值X,Y,Z)有時低於21。 2014-01-20 00:05:00和2014-01-20 00:11:00之間的值也可能會丟失。
我可以考慮循環播放這個系列,但我更喜歡矢量化的方法。我想在R中實現它,但是Python或Matlab也可以。
任何想法?謝謝。
2014-01-20 00:00:00 197021
2014-01-20 00:01:00 197021
2014-01-20 00:02:00 197021
2014-01-20 00:03:00 197021
2014-01-20 00:04:00 197021
2014-01-20 00:05:00 197021
2014-01-20 00:06:00 197021
2014-01-20 00:07:00 197021
2014-01-20 00:08:00 197021
2014-01-20 00:09:00 197021
2014-01-20 00:10:00 197021
2014-01-20 00:11:00 197021
2014-01-20 00:12:00 197021
2014-01-20 00:13:00 197021
2014-01-20 00:14:00 197021
2014-01-20 00:15:00 197021
2014-01-20 00:16:00 196836
2014-01-20 00:17:00 196865
2014-01-20 00:18:00 196787
2014-01-20 00:19:00 196915
2014-01-20 00:20:00 196902
2014-01-20 00:21:00 196902
2014-01-20 00:22:00 196902
2014-01-20 00:23:00 196902
2014-01-20 00:24:00 196902
2014-01-20 00:25:00 196902
2014-01-20 00:26:00 196902
2014-01-20 00:27:00 196902
2014-01-20 00:28:00 196902
2014-01-20 00:29:00 196902
缺失的數據是什麼樣的?因爲否則,它聽起來像是你只想從第27行開始的25行組(即Matlab中的'BCDY = data(27:27 + 25,:)') – Dan
你能以方便的方式與我們分享數據嗎?這裏有一些關於如何做到這一點的提示:http://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example我打賭'rle'將成爲最終解決方案的一部分,雖然。 –
爲什麼在''00:16:00 196836''和''00:17:00 196865''之間有空格?我明白這個白色空間實際上並不存在,真正的問題是:什麼區分一個時間序列和下一個時間序列? – eyquem