這應該是一個容易的,但不知何故,我找不到一個有效的解決方案。熊貓 - dataframe groupby - 如何獲得多列總和
我有一個熊貓數據幀,看起來像這樣:
index col1 col2 col3 col4 col5
0 a c 1 2 f
1 a c 1 2 f
2 a d 1 2 f
3 b d 1 2 g
4 b e 1 2 g
5 b e 1 2 g
我想GROUP BY col1和col2上,並得到COL3和COL4的sum()
。Col5
可以被丟棄,因爲數據不能被聚合。
下面是輸出結果的樣子。我有興趣在結果數據框中同時使用col3
和col4
。 col1
和col2
是否是索引的一部分並不重要。
index col1 col2 col3 col4
0 a c 2 4
1 a d 1 2
2 b d 1 2
3 b e 2 4
這裏是我的嘗試:
df_new = df.groupby(['col1', 'col2'])["col3", "col4"].sum()
這不過只是返回col4
的彙總結果。
我迷失在這裏。我找到的每個示例都只彙總了一列,問題顯然不會發生。
問題可能是'df.col3.dtype'很可能不是一個'int'或數字數據類型。在做'groupby'之前嘗試'df.col3 = df.col3.astype(int)' –