2012-06-13 42 views
2

我目前正在與來自pandas 0.8.0b1的reasmpling函數打交道。用熊貓0.8重新採樣的問題?

例如,當我嘗試(使用「意味着」)10分鐘值月值聚集,功能似乎在下個月的平均使用的數據的最後一天,從一個月...

下面是一個例子用3月份的10點分鐘的數據的一個簡單的時間序列與

  • 2012年1月:所有值= 1
  • 2012年2月:所有值= 2
  • 2012年3月:所有值= 3

我開始使用df.resample每月手段( 'M',如何= '平均')是:

Out[454]: 

0 
2012-01-31 1.000000 
2012-02-29 1.965757 
2012-03-31 2.967966 
2012-04-30 3.000000 

,但我想獲得這樣的:

0 
2012-02-01 1.000000 
2012-03-01 2.000000 
2012-04-01 3.000000 

下面是代碼:

january = pd.date_range(pd.datetime(2012,1,1),pd.datetime(2012,1,31,23,50),freq='10min') 
february = pd.date_range(pd.datetime(2012,2,1),pd.datetime(2012,2,29,23,50),freq='10min') 
march = pd.date_range(pd.datetime(2012,3,1),pd.datetime(2012,3,31,23,50),freq='10min') 
data_jan = np.zeros(size(january))+1 
data_feb = np.zeros(size(february))+2 
data_march = np.zeros(size(march))+3 
df1 = pd.DataFrame(data_jan,index=january) 
df2 = pd.DataFrame(data_feb,index=february) 
df3 = pd.DataFrame(data_march,index=march) 
df = pd.concat([df1,df2,df3]) 
df.resample('M',how='mean') 

如果現在我被刪除的最後一天

january = pd.date_range(pd.datetime(2012,1,1),pd.datetime(2012,1,31,00,00),freq='10min') 
february = pd.date_range(pd.datetime(2012,2,1),pd.datetime(2012,2,29,00,00),freq='10min') 
march = pd.date_range(pd.datetime(2012,3,1),pd.datetime(2012,3,31,00,00),freq='10min') 

我得到()我想:

Out[474]: 
      0 
2012-01-31 1 
2012-02-29 2 
2012-03-31 3 

你能幫我????它是一個bug嗎?

回答