我有一個非常寬的數據框> 10,000列,我需要計算每個中的空值的百分比。現在我正在做:更有效的方式來迭代和計算列數
threshold=0.9
for c in df_a.columns[:]:
if df_a[df_a[c].isNull()].count() >= (df_a.count()*threshold):
# print(c)
df_a=df_a.drop(c)
當然這是一個緩慢的過程,偶爾崩潰。有沒有更有效的方法我失蹤?
謝謝!