0
我正在經歷一個相當奇怪的熊貓時間序列(Python)重採樣函數行爲。我用的是最新版本的熊貓(0.12.0)熊貓重採樣的奇怪行爲
的採取以下時間序列:
dates = [datetime(2011, 1, 2, 1), datetime(2011, 1, 2, 2), datetime(2011, 1, 2, 3),
datetime(2011, 1, 2, 4), datetime(2011, 1, 2, 5), datetime(2011, 1, 2, 6)]
ts = Series(np.arange(6.), index=dates)
然後嘗試重新採樣,以66S和65S來。這是我得到的結果:
In [45]: ts.resample('66min')
Out[45]:
2011-01-02 01:00:00 0.5
2011-01-02 02:06:00 2.0
2011-01-02 03:12:00 3.0
2011-01-02 04:18:00 4.0
2011-01-02 05:24:00 5.0
Freq: 66T, dtype: float64
In [46]: ts.resample('65min')
Out[46]:
2011-01-02 01:00:00 0
2011-01-02 02:05:00 NaN
2011-01-02 03:10:00 NaN
2011-01-02 04:15:00 NaN
2011-01-02 05:20:00 NaN
2011-01-02 06:25:00 NaN
Freq: 65T, dtype: float64
我明白當重新採樣到66s時的行爲。它始終採用相應間隔中所有值的平均值(默認值)。 我不明白,也不知道如何影響65年代的行爲。
這是一個簡化的問題。背景是一個更復雜的數據校正過程,涉及重採樣。
任何想法?
你必須選擇'fill_method'。你想得到什麼結果? –