2017-01-16 96 views
0

我有一個數據框有多個列。我想遍歷列,計算每列有多少空值,並生成一個新的數據框,它顯示列標題名稱旁邊的isnull值的總和。熊貓isnull與列標題總和

如果我做的:

for col in main_df: 
    print(sum(pd.isnull(data[col]))) 

我得到的每個列的空計數的列表:

0 
1 
100 

我試圖做的是創建具有列一個新的數據幀標題與無效計數一起,例如

col1 | 0 
col2 | 1 
col3 | 100 
+0

欺騙:http://stackoverflow.com /問題/ 26266362 /如何對計數的楠值-內式列在熊貓數據幀 – EdChum

回答

0

試試這個:

In [71]: df 
Out[71]: 
    a b c 
0 NaN 7.0 0 
1 0.0 NaN 4 
2 2.0 NaN 4 
3 1.0 7.0 0 
4 1.0 3.0 9 
5 7.0 4.0 9 
6 2.0 6.0 9 
7 9.0 6.0 4 
8 3.0 0.0 9 
9 9.0 0.0 1 

In [72]: pd.isnull(df).sum() 
Out[72]: 
a 1 
b 2 
c 0 
dtype: int64 

或:

In [76]: df.isnull().sum() 
Out[76]: 
a 1 
b 2 
c 0 
dtype: int64 

,你可以在它外面創建一個DF:

In [78]: df.isnull().sum().to_frame('nulls') 
Out[78]: 
    nulls 
a  1 
b  2 
c  0