我有一個看起來像這樣的文本文件中的數據集。使用熊貓閱讀文本文件,其中一些行有空元素?
0 0CF00400 X 8 66 7D 91 6E 22 03 0F 7D 0.021650 R
0 18EA0080 X 3 E9 FE 00 0.022550 R
0 00000003 X 8 D5 64 22 E1 FF FF FF F0 0.023120 R
我讀這使用
file_pandas = pd.read_csv(fileName, delim_whitespace = True, header = None, engine = 'python')
,並得到了輸出
0 0 0CF00400 X 8 66 7D 91 6E 22 03 0F 7D 0.02165
1 0 18EA0080 X 3 E9 FE 0 0.022550 R None None None NaN
2 0 00000003 X 8 D5 64 22 E1 FF FF FF F0 0.02312
但我想這個理解爲
0 0 0CF00400 X 8 66 7D 91 6E 22 03 0F 7D 0.021650 R
1 0 18EA0080 X 3 E9 FE 00 0.022550 R
2 0 00000003 X 8 D5 64 22 E1 FF FF FF F0 0.023120 R
我試圖消除delim_whitespace = True
和更換它與delimiter = " "
但它只是將上面顯示的輸出中的前四列組合起來,但它確實正確地解析了其餘數據,這意味着其餘列像原始txt文件(禁止空格中的NaN值)。
我不知道如何從這裏開始。
附註:00
被解析爲僅0
。有沒有辦法顯示00
?
這看起來像一個固定寬度的文件,你可以試試'read_fwf'還你有標籤或空間在這裏?爲了保留'00',你需要傳遞'dtype = np.object' – EdChum