1
計數總和我有一個表中的大熊貓DF分組多個列,並且在大熊貓DF
master_id pidx pidy flag count
xxx a b A 10
xxx a c A 20
xxx a d A 30
xxx b d A 40
xxx a c C 50
xxx a c C 60
xxx x y C 70
xxx x y C 80
我想做的事情上多列,也不論標誌的總結計數的分組。
即
xxx a c A 20
xxx a c C 50
xxx a c C 60
最終輸出應該是
xxx a c A 130
決賽桌應該是
master_id pidx pidy flag count
xxx a b A 10
xxx a c A 130
xxx a d A 30
xxx b d A 40
xxx x y C 150
你的代碼的工作,但說我有一個多列說master_id,那麼我就可以」 t在'df.groupby(['master_id','pidx','pidy'])中添加該列''看到我用另一列編輯了我的df。 – Shubham
我把葉ID放在agg函數中,它似乎工作,'df = df.groupby(['pidx','pidy'])。agg({'leafId':'first','flag':'first', 'count':'sum'})。reset_index()'但它是正確的方式嗎? – Shubham
這取決於你需要什麼。如果需要按列pydx和pidy分組,並獲得第一列的leafId和標誌,並且對列計數中的所有行進行求和,那麼您是正確的。 – jezrael