1
我有這個數據幀。在一定條件下聚合
df = pd.DataFrame({'day':[1,2,1,4,2,3], 'user':['A','B','B','B','A','A'],
'num_posts':[1,2,3,4,5,6]})
我想要一個新列,包含該用戶截止當天的帖子總數。我想要的樣子:
user day num_post total_todate
A 1 1 0
B 2 2 3
B 1 3 0
B 4 4 5
A 2 5 1
A 3 6 6
任何想法?
或者,也許使用應用'df.sort_values([「用戶」 ,'day'])。groupby('user')。apply(lambda x:x ['num_posts']。cumsum()。shift()。fillna(0))' – Wen