熊貓重採樣的奇怪行爲

我正在經歷一個相當奇怪的熊貓時間序列（Python）重採樣函數行爲。我用的是最新版本的熊貓（0.12.0）熊貓重採樣的奇怪行爲

的採取以下時間序列：

dates = [datetime(2011, 1, 2, 1), datetime(2011, 1, 2, 2), datetime(2011, 1, 2, 3), 
      datetime(2011, 1, 2, 4), datetime(2011, 1, 2, 5), datetime(2011, 1, 2, 6)] 
ts = Series(np.arange(6.), index=dates)

然後嘗試重新採樣，以66S和65S來。這是我得到的結果：

In [45]: ts.resample('66min') 
Out[45]: 
2011-01-02 01:00:00 0.5 
2011-01-02 02:06:00 2.0 
2011-01-02 03:12:00 3.0 
2011-01-02 04:18:00 4.0 
2011-01-02 05:24:00 5.0 
Freq: 66T, dtype: float64 

In [46]: ts.resample('65min') 
Out[46]: 
2011-01-02 01:00:00  0 
2011-01-02 02:05:00 NaN 
2011-01-02 03:10:00 NaN 
2011-01-02 04:15:00 NaN 
2011-01-02 05:20:00 NaN 
2011-01-02 06:25:00 NaN 
Freq: 65T, dtype: float64

我明白當重新採樣到66s時的行爲。它始終採用相應間隔中所有值的平均值（默認值）。我不明白，也不知道如何影響65年代的行爲。

這是一個簡化的問題。背景是一個更復雜的數據校正過程，涉及重採樣。

任何想法？

來源

2013-08-16 user2689410

你必須選擇'fill_method'。你想得到什麼結果？ –

也許你想插值而不是resample。這裏有一種方法：

In [53]: index = pd.date_range(freq='66T', start=ts.first_valid_index(), periods=5) 

In [54]: ts.reindex(set(ts.index).union(index)).sort_index().interpolate('time').ix[index] 
Out[54]: 
2011-01-02 01:00:00 0.0 
2011-01-02 02:06:00 1.1 
2011-01-02 03:12:00 2.2 
2011-01-02 04:18:00 3.3 
2011-01-02 05:24:00 4.4 
Freq: 66T, dtype: float64 

In [55]: index = pd.date_range(freq='65T', start=ts.first_valid_index(), periods=5) 

In [56]: ts.reindex(set(ts.index).union(index)).sort_index().interpolate('time').ix[index] 
Out[56]: 
2011-01-02 01:00:00 0.000000 
2011-01-02 02:05:00 1.083333 
2011-01-02 03:10:00 2.166667 
2011-01-02 04:15:00 3.250000 
2011-01-02 05:20:00 4.333333 
Freq: 65T, dtype: float64

這就是說，似乎resample可以改進。乍一看，你所表現出來的行爲是神祕的，我同意，這是無益的。值得討論。

來源

2013-08-16 14:45:27

這是一個非常好的方法，謝謝！看起來像我的功能有希望的基礎。 – user2689410

熊貓重採樣的奇怪行爲

回答

相關問題