2016-08-06 35 views
-2

我正在閱讀使用'pd.read_csv'的csv文件並使用'file.to_csv'將其寫入另一個csv。它不正確地在輸出文件中顯示標題。例如,熊貓read_csv不正確地讀取標題

輸入

ABC | 20151004 | 1900 | 0000000002 | MUPPETS SP 1-10/4, THE | | | R|RS 

0 

0 

0 

0 

0 

2993 

腳本

data = pd.read_csv(r'filepath/input.csv') 

打印數據

輸入頭ABC | 20151004 | 1900 | 0000000002 | MUPPETS SP 1-10/4, THE | | | R|RS

輸出頭ABC | 20151004 | 1900 | 0000000002 | MUPPETS SP 1-10/4, THE | | | R|RS.1

不知道爲什麼它被添加到'.1'一些標題的末尾。

+2

添加從這裏CSV文件的第五行。 – RAVI

+0

可能的重複http://stackoverflow.com/questions/20845213/how-to-avoid-python-pandas-creating-an-index-in-a-saved-csv – Kartik

+0

更好的重複問題:http:// stackoverflow。 com/questions/26786960/pandas-to-csv-first-extra-column-remove-how-to – Kartik

回答

0

試試這個:

data = pd.read_csv(r'filepath/input.csv',sep='|') 

的rs.1可能指示重複的 'RS' 列

+0

謝謝。你是對的。這是一個大文件,我沒有注意到它,它是一個重複的列。有沒有一種方法可以直接讀取列,而不需要在最後添加'.1'? –

+0

你需要添加一些問題的列,來解決。那些看起來不像標題,而是它的所有數據。在發佈問題之前,您還需要完成一個教程。 https://people.duke.edu/~ccc14/sta-663/IntroductionToPythonSolutions.html – Merlin