如果我有一個簡單的表格,如:先進的聚集大熊貓蟒蛇
index location col1 col2 col3 col4
1 a TRUE yes 1 4
2 a FALSE null 2 6
3 b TRUE null 6 3
4 b TRUE no 3 4
5 b FALSE yes 4 6
6 c TRUE no 57 8
7 d FALSE null 74 9
如果我想聚集在位置重複的記錄,即兩個A或三個B的,我一直在使用一個基本groupby函數。這適用於簡單的表格。
但是,是否可以擴展此功能,以便在聚合時允許每列的規則?作爲col1的一個例子,如果TRUE存在,它會勝過任何FALSE值,或者在col3中,它會對這些值進行求和,而在col4中它會計算平均值?是否可以爲每列定義這些規則,然後在使用groupby時應用它們?
我在網上搜索,但沒有發現任何似乎覆蓋這個,但我可能會吠叫錯誤的樹。
謝謝。
您可以發佈想要的/預期的數據集嗎? – MaxU