我從CSV一個數據幀,看起來像這樣(這裏樣本數據:http://www.speedyshare.com/9A2zf/download/sample.csv):從標準化CSV提取間苗時間序列使用熊貓
event name user count amount commission
2011-05-23 00:00:00 2011-07-22 normal reading_arts 2 26 0.0
2011-05-23 00:00:00 2011-07-23 normal reading_arts 14 182 0.0
2011-05-24 00:00:00 2011-07-22 normal reading_arts 4 52 0.0
2011-05-24 00:00:00 2011-07-22 normal reading_arts 3 39 0.0
2011-05-26 00:00:00 2011-07-23 normal reading_arts 2 30 0.0
2011-05-26 00:00:00 2011-07-23 normal reading_arts 5 75 0.0
2011-05-26 00:00:00 2011-07-22 normal reading_arts 1 13 0.0
2011-05-27 15:39:28 2011-07-23 normal hickies 16 208 -10.4
2011-06-01 00:00:00 2011-07-23 normal reading_arts 2 30 0.0
2011-06-02 00:00:00 2011-07-23 normal reading_arts 17 221 0.0
..that我創建:
data = read_csv('2011.csv',
names=('event', 'user', 'count', 'amount', 'commission'),
parse_dates=True)
「事件」雖然看起來像日期,但實際上只是特定事件的標識符。
您會注意到DateTimeIndex中有重複的條目,例如:2011-05-23 00:00:00。
我最終想要的是每個用戶對每個事件的一系列3個時間序列(每個計數,金額和佣金),通過總結下采樣到每週桶。我還想爲每個事件創建類似的時間序列,這只是每個用戶每個事件時間序列的總和。
我該怎麼做?
將是有益的提供樣本CSV摘錄,讓人們輕鬆地重新創建數據框...這裏玩弄 –