2015-05-07 99 views
1

在數據幀索引丟失數據的工作,我得到了以下數據框(樣品):熊貓:按時間

   date Value1 Value2 
2007-05-25 11:50:00 1  15 
2007-05-25 12:00:00 2  30 
2007-05-25 12:10:00 3  25 
2007-05-25 12:50:00 2  34 
2007-05-25 13:00:00 9  35 
2007-05-25 13:10:00 6  10 

你可以看到從2007-05-25 12:20:00數據,直到2007-05-25 12:40:00丟失。我想要做的是這樣一個數據框:

   date Value1 Value2 
2007-05-25 11:50:00 1  15 
2007-05-25 12:00:00 2  30 
2007-05-25 12:10:00 3  25 
2007-05-25 12:20:00 NaN  NaN 
2007-05-25 12:30:00 NaN  NaN 
2007-05-25 12:40:00 NaN  NaN 
2007-05-25 12:50:00 2  34 
2007-05-25 13:00:00 9  35 
2007-05-25 13:10:00 6  10 

一般我想看看哪個時間我沒有數據。我想是這樣的:

DataRange = pd.date_range(data.index[0],data.index[-1]) 
data = data.reindex(DataRange, fill_value=nan) 

但據我通過測試date_range underastand作爲函數表示,通過其名稱中的日期範圍。所以我想知道是否有類似的分鐘(在我的情況下10分鐘)還是有另一種方式來實現。

+0

如果我的答案回答了你的問題,你能接受的話,將會有一個空刻度我答案的左上角,謝謝 – EdChum

+0

我是afk。感謝你的回答。 –

回答

1

呼叫resample並通過規則爲「10分鐘」:

In [309]: 

df.resample('10Min') 
Out[309]: 
        Value1 Value2 
date        
2007-05-25 11:50:00  1  15 
2007-05-25 12:00:00  2  30 
2007-05-25 12:10:00  3  25 
2007-05-25 12:20:00  NaN  NaN 
2007-05-25 12:30:00  NaN  NaN 
2007-05-25 12:40:00  NaN  NaN 
2007-05-25 12:50:00  2  34 
2007-05-25 13:00:00  9  35 
2007-05-25 13:10:00  6  10 

一些例子可以發現here