1
我有多個數據幀與日期列。我想在日期列中將這些數據框分組5天。通常情況下是這樣的工作:熊貓削減或groupby日期範圍
df = pd.DataFrame([['2016-11-01 09:21:07', 10], ['2016-09-14 02:46:01', 21], ['2016-08-11 03:26:33', 14], ['2016-10-17 14:20:44', 14]],
columns=['DateCol', 'Values'])
df['DateCol'] = pd.to_datetime(df['DateCol'])
df.set_index('DateCol').groupby(pd.TimeGrouper('5D')).mean()
然而,當我使用pd.TimeGrouper
它創建一個基於我把它應用到數據幀組。如果我在兩個不同的數據框上執行此操作,則會生成不同的組。 我想通過相同的組對多個數據幀進行分組。
我嘗試過使用pd.cut
,但它不適用於日期時間列。 pd.cut(df['DateCol'], 10)
給我TypeError
。
理想我想要做這樣的事情:
pd.groupby(df, pd.cut(df['DateCol'], pd.date_range(start='1/1/2016', end='1/1/2017', freq='5D')))
換句話說,我需要在特定日期範圍內的GroupBy我數據幀。