我想清理一個數據集,基本上擺脫了所有具有一定數量的空值的特徵,包含100多個空值熊貓/蟒蛇。我使用下面的命令獲取包含空值的特徵列表(蟒蛇/熊貓)
train.isnull().sum()>=100
這讓我:
Id False
Feature 1 False
Feature 2 False
Feature 3 True
Feature 4 False
Feature 5 True
我想沒有功能3和4
謝謝返回一個新的數據幀。
我想清理一個數據集,基本上擺脫了所有具有一定數量的空值的特徵,包含100多個空值熊貓/蟒蛇。我使用下面的命令獲取包含空值的特徵列表(蟒蛇/熊貓)
train.isnull().sum()>=100
這讓我:
Id False
Feature 1 False
Feature 2 False
Feature 3 True
Feature 4 False
Feature 5 True
我想沒有功能3和4
謝謝返回一個新的數據幀。
在你的情況下,只需要運行:
train[train.columns[train.isnull().sum()<100]]
完整的示例:
import pandas as pd
df = pd.DataFrame([[1,None,2],[3,4,None],[7,8,9]], columns = ['A','B','C'])
您將獲得:
A B C 0 1 NaN 2.0 1 3 4.0 NaN 2 7 8.0 9.0
然後運行:
df.isnull().sum()
將導致空計數:
A 0 B 1 C 1
然後只需選擇需要的列:
df.columns[df.isnull().sum()<100]
和過濾數據幀:
df[ df.columns[df.isnull().sum()<100]]
請提供一個可重現的數據集示例。 – www