2017-08-18 165 views
3

我讀一個excel文件到大熊貓的Excel文件,但我得到以下幾點:閱讀在熊貓

Out[8]: 
0  \tFLOOD LIGHTS\t 
1  \tFLOOD LIGHTS\t 
2  \tPAR 38 LIGHT\t 
3    \tMILO\t 
4 \tQ-12251-DO1 MILO\t 

我不希望在我的數據「\ t」的。這裏是我的熊貓閱讀命令:

import pandas as pd 
data = pd.read_ex('/home/Desktop/sample.xlsx') 
+0

您希望看到的輸出是什麼?你目前有什麼問題? – SeeDerekEngineer

+1

我不認爲這是一個熊貓問題。你實際上可能在Excel文件中有這些製表符。 – ayhan

+0

我希望這些'\ t'被刪除,是否有任何編碼問題? –

回答

2

看來你的數據中有拖尾標籤。

所以需要strip對於其刪除:

data['col'] = data['col'].str.strip() 

如果所有列:

data = data.apply(lambda x: x.str.strip()) 

#then convert possible numeric columns 
data['num_col'] = data['num_col'].astype(int) 

或者,如果需要刪除\t字符串使用replace^字符串的開始和$最終:

data = data['col'].replace(['^\t', '\t$'], '', regex=True) 
+0

這真的很有幫助。謝謝 –

+0

很高興能幫助,祝你好運! – jezrael