2017-04-11 53 views
1

我有一個數據集,有100列和50萬行。對於列Z,某些值缺失。我將首先將數據按2列(A,B)分組,然後對於每個組,我得到中位數(跳過這些nans),然後我想用相應組的中位數填充Z中的nans。熊貓填補缺失值與給定的中位數

我可以

df.groupby(["A","B"]).Z.median() 

但它也有NaN的一些集團和我不知道如何着手,真正填補這些NaN的在Z由組中位數...

回答

1

嘗試:

df.groupby(["A","B"]).Z.apply(lambda x: x.fillna(x.median()))