1
過濾掉連續的行我與索引值和一個日期時間變量的數據集如下:從數據集
1 2017-01-03 09:30:01.958
46 2017-01-03 09:30:47.879
99 2017-01-03 09:33:48.121
117 2017-01-03 09:47:06.215
139 2017-01-03 09:51:06.054
1567 2017-01-03 14:17:18.949
2480 2017-01-03 15:57:13.442
2481 2017-01-03 15:57:14.333
2486 2017-01-03 15:57:37.500
2487 2017-01-03 15:57:38.677
2489 2017-01-03 15:57:41.053
2491 2017-01-03 15:57:54.870
2498 2017-01-03 15:59:24.210
我所試圖做的是從數據刪除連續行(只保留第一從段觀察),在這種情況下,代碼應與指數2481和2487掉落行我嘗試使用
df[df.index.diff() == 0].drop()
但它只返回
AttributeError: 'Int64Index' object has no attribute 'diff'
我知道你們有些東西在你的袖子裏。有趣的是,[df.index.to_series()。diff()!= 1]會返回相同的結果 –
我很喜歡你的可讀性,但是我做了一次timecomparison,爲什麼這麼慢呢?它是to_series()轉換嗎? –
相同的答案,但''numpy-fied' ___'df [np.append(0,np.diff(df.index.values))!= 1]'這應該加快它。 – piRSquared