0
我有以下的熊貓數據框:重複值大熊貓據幀
email cat class_price
0 [email protected] cat1 1
1 [email protected] cat2 2
2 [email protected] cat2 4
3 [email protected] cat2 4
4 [email protected] cat2 1
5 [email protected] cat1 3
6 [email protected] cat1 2
7 [email protected] cat2 1
8 [email protected] cat2 4
9 [email protected] cat2 2
10 [email protected] cat3 1
11 [email protected] cat1 1
我想組通過電子郵件和class_price,每行我想借此class_price的最大值。
我使用:
test_df2 = test_df.groupby(['email','cat'])['class_price'].max()
輸出是:
email cat
[email protected] cat1 2
cat2 4
[email protected] cat2 2
cat3 1
[email protected] cat1 3
cat2 4
但我怎麼能得到一個結果,甚至分組的列保留重複的值,例如,它可以被寫成具有所有值的適當表格:
email cat maxvalue
[email protected] cat2 2
[email protected] cat1 2
[email protected] cat3 3
注意:示例輸出與示例輸入ju不兼容st寫的解釋這個想法。
您可以添加輸入數據的輸出嗎?或者更改輸入數據以便更好地理解? – jezrael