2017-08-13 25 views
0

groupby對象的長度與groupby對象的索引長度之間的區別是什麼?我希望爲這兩個報表返回相同的數字。groupby及其索引的計數差異

len(Fees.groupby(['InstituteCode','Code','ProgramType','Status','AcademicYear'])) 
8000 

爲什麼我會得到不同的數字?

len(Fees.groupby(['InstituteCode','Code','ProgramType','Status','AcademicYear']).indices) 
7433 

這是否意味着對於給定的列列表,我只有7433個不同的記錄?

回答

0

這是因爲對於568條記錄,「代碼」列爲null。那些被groupby跳過。當我使用...檢查空值時變得清楚...

df.apply(lambda x: x.isnull().sum())