2
我有兩列感興趣的時間戳數據:'標籤'和一個計數。我想創建一個時間序列,每個標籤的總和,比如說一天。我可以使用resample
來實現嗎?用熊貓重新取樣'整齊'數據框
具體的例子:
import pandas as pd
import numpy as np
from itertools import cycle
idx = pd.date_range('2016-01-01', '2016-01-07', freq='H')
n = np.random.randint(10, size=24*6+1)
lst = [(l,c) for l,c in zip(cycle(['foo', 'bar']), n)]
df = pd.DataFrame(lst, index=idx, columns=['label', 'n'])
df.resample(???).sum()
在這個例子中,目標數據幀應該包含一個時間索引並含有每時間間隔的總計數兩列(foo
和bar
)。
我做不期望成爲可能用'groupby'鏈接'resample',非常強大。作爲一個便箋,我想出了第三種方式,使用TimeGrouper:'df.groupby([pd.TimeGrouper('W'),'label'])'。 –