1
我有一個數據集,有100列和50萬行。對於列Z
,某些值缺失。我將首先將數據按2列(A,B)
分組,然後對於每個組,我得到中位數(跳過這些nans),然後我想用相應組的中位數填充Z
中的nans。熊貓填補缺失值與給定的中位數
我可以
df.groupby(["A","B"]).Z.median()
但它也有NaN的一些集團和我不知道如何着手,真正填補這些NaN的在Z
由組中位數...
我有一個數據集,有100列和50萬行。對於列Z
,某些值缺失。我將首先將數據按2列(A,B)
分組,然後對於每個組,我得到中位數(跳過這些nans),然後我想用相應組的中位數填充Z
中的nans。熊貓填補缺失值與給定的中位數
我可以
df.groupby(["A","B"]).Z.median()
但它也有NaN的一些集團和我不知道如何着手,真正填補這些NaN的在Z
由組中位數...
嘗試:
df.groupby(["A","B"]).Z.apply(lambda x: x.fillna(x.median()))