2017-04-16 189 views
2

我有一個數據文件,我試圖放入圖表等。在數據的某些部分,有-個字符表示未收集數據。我知道data.dropna()通常會完成這項工作,但缺少的數據代表-從熊貓數據框中刪除部分無效數據(Python)

+1

情侶選項。假設你正在使用read_csv(),你可以使用na_values arg。或者你做這樣的'df.replace(' - ',np.nan).dropna()' –

回答

3

假設我有一個CSV文件test.csv看起來像

col1,col2,col3 
1,-,2 
-,3,4 

我可以告訴pd.read_csv處理'-'nan時,它讀取

df = pd.read_csv('test.csv', na_values=['-']) 

df 

    col1 col2 col3 
0 1.0 NaN  2 
1 NaN 3.0  4 

從那裏,你可以dropna正常