熊貓填補缺失值與給定的中位數

我有一個數據集，有100列和50萬行。對於列Z，某些值缺失。我將首先將數據按2列(A,B)分組，然後對於每個組，我得到中位數（跳過這些nans），然後我想用相應組的中位數填充Z中的nans。熊貓填補缺失值與給定的中位數

我可以

df.groupby(["A","B"]).Z.median()

但它也有NaN的一些集團和我不知道如何着手，真正填補這些NaN的在Z由組中位數...

2017-04-11 kim kevin

嘗試：

df.groupby(["A","B"]).Z.apply(lambda x: x.fillna(x.median()))

2017-04-11 03:23:50 Abdou

回答