下面我有一個數據集的樣本(只顯示前幾行,但也有193行):groupby是否會自動將大熊貓中的所有非數字列分組?
country,beer_servings,spirit_servings,wine_servings,total_litres_of_pure_alcohol,continent
Afghanistan,0,0,0,0.0,Asia
Albania,89,132,54,4.9,Europe
Algeria,25,0,14,0.7,Africa
Andorra,245,138,312,12.4,Europe
Angola,217,57,45,5.9,Africa
Antigua & Barbuda,102,128,45,4.9,North America
...
當我運行此:drinks.groupby('continent').head()
我回去用30行的數據幀。但在這30行中,我仍然有continent
的重複名稱。例如下面的圖片可以看到,Europe
重複兩次(在行1和3):
我無法理解爲什麼我仍然有相同的大陸時,兩排我原本是按大洲分組的?
在這種情況下,groupby
操作也分組country
即使我從來沒有在groupby
函數中指定它嗎?因爲我知道在SQL中你應該使用像max
,min
,sum
等聚合函數。但在這種情況下,我不必傳入一個聚合函數,我得到了上面的結果。
但是當我沒有傳入任何參數時,間接它仍然是由'continent'和'country'分組來糾正的?由於歐洲大陸有多行,因此「歐洲」。 – CapturedTree
這是正確的。 – DyZ
我說的是正確的? – CapturedTree