我試圖瞭解/使用熊貓的GROUPBY將各組內獲得最大的計數,然後用最大計數Python的大熊貓GROUPBY行爲
df = pd.DataFrame({'name':['alpha','beta','gamma','delta','epsilon'], 'year':[2000,2001,2000,2001,2000], 'count':[1,25,11,20,8]})
df
count name year
0 1 alpha 2000
1 25 beta 2001
2 11 gamma 2000
3 20 delta 2001
4 8 epsilon 2000
df.groupby('year').max()
count name
year
2000 11 gamma
2001 25 delta
我通過一年,但我的分組返回的行像輸出d的樣子:
count name
year
2000 11 gamma
2001 25 beta
所以,我想從每個組返回整行(由「年」)的基礎上最大計數。我也不清楚2001年爲什麼在名稱而不是「測試版」中返回「三角洲」(正如我所期望的那樣)。
它給出delta的原因是,當你直接對groupby對象執行'.max()'時,它會爲每列分別計算最大值。 '「delta」在字母表後面,因此「大於」'「beta」'。 – BrenBarn 2014-09-12 19:38:13