2
我有一個數據文件,我試圖放入圖表等。在數據的某些部分,有-
個字符表示未收集數據。我知道data.dropna()
通常會完成這項工作,但缺少的數據代表-
。從熊貓數據框中刪除部分無效數據(Python)
我有一個數據文件,我試圖放入圖表等。在數據的某些部分,有-
個字符表示未收集數據。我知道data.dropna()
通常會完成這項工作,但缺少的數據代表-
。從熊貓數據框中刪除部分無效數據(Python)
假設我有一個CSV文件test.csv
看起來像
col1,col2,col3
1,-,2
-,3,4
我可以告訴pd.read_csv
處理'-'
像nan
時,它讀取
df = pd.read_csv('test.csv', na_values=['-'])
df
col1 col2 col3
0 1.0 NaN 2
1 NaN 3.0 4
從那裏,你可以dropna
正常
情侶選項。假設你正在使用read_csv(),你可以使用na_values arg。或者你做這樣的'df.replace(' - ',np.nan).dropna()' –