2017-07-01 86 views
2

我想清理一個數據集,基本上擺脫了所有具有一定數量的空值的特徵,包含100多個空值熊貓/蟒蛇。我使用下面的命令獲取包含空值的特徵列表(蟒蛇/熊貓)

train.isnull().sum()>=100 

這讓我:

Id False 
Feature 1 False 
Feature 2 False 
Feature 3 True 
Feature 4 False 
Feature 5 True 

我想沒有功能3和4

謝謝返回一個新的數據幀。

+0

請提供一個可重現的數據集示例。 – www

回答

1

在你的情況下,只需要運行:

train[train.columns[train.isnull().sum()<100]] 

完整的示例:

import pandas as pd 
df = pd.DataFrame([[1,None,2],[3,4,None],[7,8,9]], columns = ['A','B','C']) 

您將獲得:

A B  C 
0 1 NaN 2.0 
1 3 4.0 NaN 
2 7 8.0 9.0 

然後運行:

df.isnull().sum() 

將導致空計數:

A 0 
B 1 
C 1 

然後只需選擇需要的列:

df.columns[df.isnull().sum()<100] 

和過濾數據幀:

df[ df.columns[df.isnull().sum()<100]] 
+1

確實,它工作得很好,謝謝! – Liky

+0

太棒了!如果它解決了你的問題,考慮upvoting和標記答案是正確的:) – Dimgold

+0

我標記的答案是正確的!我也提出了答案,但迄今爲止太新手(少於15個聲譽)才能顯示。 – Liky