我有一個Pandas
數據幀,其中包含兩組日期,DatetimeIndex
用於索引,而date2
列包含datetime對象,一個值和一個id。對於某些id,我缺少date2
等於索引的值,在這種情況下,我想用前一個DatetimeIndex和id的值填充行/值。 date1
代表當前時間點,date2
代表最後一個日期。每個df[df.id == id]
可以被視爲自己的數據幀,但數據存儲在一個巨型數據幀500k行中。熊貓回填基於日期時間索引和列的值
實例:假設
date2 id value
index
2006-01-24 2006-01-26 3 3
2006-01-25 2006-01-26 1 1
2006-01-25 2006-01-26 2 2
2006-01-26 2006-01-26 2 2.1
2006-01-27 2006-02-26 4 4
在這個例子中,進行了缺少index == date2
一行ID 1,ID 2和用於ID3。我想用與它的id相對應的前一個索引值來回填每個缺失的行。
我想回:
date2 id value
index
2006-01-24 2006-01-26 3 3
2006-01-25 2006-01-26 1 1
2006-01-25 2006-01-26 2 2
2006-01-26 2006-01-26 1 1 #<---- row added
2006-01-26 2006-01-26 2 2.1
2006-01-26 2006-01-26 3 3 #<---- row added
2006-01-27 2006-02-26 4 4
2006-02-26 2006-02-26 4 4 #<---- row added
你能解釋一下你添加新行的邏輯嗎? – fixxxer