2017-06-02 60 views
1

我有一個數據框要分組在一個列與分類值。 A,B,start,end pineapple,4,2:00,3:00 pineapple,2,2:30,3:50 pineapple,8,3:30,3:40 apple,3,1:20,4:30 apple,5,1:30,4:30 ... 我希望有一個數據幀,看起來像這樣..在應用列列函數時,如何從數據框的不同列中獲取某些值?

A,B,start,end pineapple,6,2:00,3:50 apple,8,1:20,4:30 ... 凡開始和結束時間對付那些在其分組的極端...... 我怎麼能做到這一點,而無需通過每一行迭代,以保持跟蹤每個分組中的min_time和max_time?

回答

3

需要agg通過dict

df = df.groupby('A', sort=False).agg({'B':'sum', 'start':'min', 'end':'max'}) 
print (df) 
      end start B 
A       
pineapple 3:50 2:00 14 
apple  4:30 1:20 8 
相關問題