我是Python新手 - 熊貓,目前正試圖用它來檢查DataFrame中的數據是否連續。例如:什麼是最好的方式來告訴熊貓DataFrame丟失的行?
thread sequence start end
14 1 114 1647143 1672244
15 1 115 1672244 1689707
16 1 116 1689707 1713090
17 1 118 1735352 1760283
18 1 119 1760283 1788062
19 1 120 1788062 1789885
20 1 121 1789885 1790728
每一行擁有4列,在通用序列應與1步增加,所以如果一切是正確的,它看起來像116117118 ......,就像一個範圍()函數。但是,這裏的示例缺少序列== 117的行。
我試圖找到它,但我不知道該怎麼做。如果我只是逐一檢查序列,那將是低效的。期望的輸出是告訴缺失的行或用NaN填充缺失的行。
任何好的提示或建議都會有幫助。
非常感謝!正是我需要的。 – Castor
@Castor如果你只是想要的值而不是數據框,你不應該使用接受的答案。它非常緩慢。 –
@COLDSPEED是的,我注意到你說的是'最快的方法',看起來好像要慢得多的DataFrame然後找到NaN裏面,我會做一個基準測試它。感謝提示。 – Castor