我有一個DataFrame,其中包含一些我將轉換爲整數的字符串值,以供將來計算。列df['Age']
中的值有一些標記爲NaN
值的錯誤。使用dropna
函數,我丟失了整個行的一半以及其他列中的大量數據。如何在不更改主DataFrame的情況下僅選擇df['Age']
中不是NaN
值的進一步計算值。僅從列中刪除值pandas
df['Age'] = np.where(pd.to_numeric(df['Age'], 'coerce').notnull(), df['Age'], NaN)
df = df.dropna(subset=['Age'])
df['Age'] = df['Age'].astype(int)
你能提供你的數據框 –
的樣本究竟怎麼想的NaN要處理? – BallpointBen
你有沒有試過:'.dropna()'?...我不理解你對不起! – tumbleweed