1
我有一個時間序列數據集,看起來有點像彙總列值到一個序列中使用熊貓
dt userid var1 var2
2013-04-27 100001 a 50
2013-04-27 100002 a 45
2013-04-28 100001 b 10
2013-04-29 100001 c 20
2013-04-29 100002 b 15
我想每個用戶提取事件序列爲- 到一個新的DataFrame
相似到
userid activity_seq
100001 [a, b, c]
100002 [a, b]
的var1
在activity_seq
列的順序如下所述dt
柱(即,在按時間順序)。有人可以建議如何使用熊貓來實現這一點嗎?
在此先感謝。
下面就來重建原始DataFrame
片段,
import pandas as pd
l1 = ['2013-04-27', '2013-04-27', '2013-04-28', '2013-04-29', '2013-04-29']
l2 = [100001, 100002, 100001, 100001, 100002]
l3 = ['a','a','b','c','b']
l4 = [50, 45, 10, 20, 15]
df = pd.DataFrame({'dt':l1, 'userid':l2, 'var1':l3, 'var2':l4})