我有一個熊貓數據框,其中一列表示另一列中的位置值是否在其下面的行中發生了變化。作爲一個例子,遍歷熊貓數據框
2013-02-05 19:45:00 (39.94, -86.159) True
2013-02-05 19:50:00 (39.94, -86.159) True
2013-02-05 19:55:00 (39.94, -86.159) False
2013-02-05 20:00:00 (39.777, -85.995) False
2013-02-05 20:05:00 (39.775, -85.978) True
2013-02-05 20:10:00 (39.775, -85.978) True
2013-02-05 20:15:00 (39.775, -85.978) False
2013-02-05 20:20:00 (39.94, -86.159) True
2013-02-05 20:30:00 (39.94, -86.159) False
所以,我想要做的是去逐行通過這個數據幀,並與False
檢查行。然後(可能會添加另一列),在那個地方總共花費了「連續」時間。像上面的例子一樣,可以再次訪問同一個地方。在這種情況下,它被認爲是一個單獨的條件。所以,上面的例子中,是這樣的:
2013-02-05 19:45:00 (39.94, -86.159) True 0
2013-02-05 19:50:00 (39.94, -86.159) True 0
2013-02-05 19:55:00 (39.94, -86.159) False 15
2013-02-05 20:00:00 (39.777, -85.995) False 5
2013-02-05 20:05:00 (39.775, -85.978) True 0
2013-02-05 20:10:00 (39.775, -85.978) True 0
2013-02-05 20:15:00 (39.775, -85.978) False 15
2013-02-05 20:20:00 (39.94, -86.159) True 0
2013-02-05 20:25:00 (39.94, -86.159) False 10
我會然後繪製的使用每天HIST()函數花這些「持續」時間的直方圖。如何通過遍歷數據框從第一個數據幀中獲取第二個數據幀?我是python和熊貓的新手,真正的數據文件非常龐大,所以我需要一些相當高效的東西。
非常好! – John