2016-02-18 86 views
2

我讀一個CSV如何跳過幾行上熊貓

df = pd.read_csv('file_1.csv') 

,並得到這個錯誤:

Error tokenizing data. C error: Expected 3 fields in line 196, saw 4 

所以我把:

df = pd.read_csv('file_1.csv',skiprows=196) 

現在我GE:

Error tokenizing data. C error: Expected 4 fields in line 203, saw 5 

我嘗試:

df = pd.read_csv('file_1.csv',skiprows=196,203) 

df = pd.read_csv('file_1.csv',skiprows=[196,203]) 

無論工作

編輯。

當我嘗試:

df = pd.read_csv('items_sch_1.csv',skiprows=[196,203]) 

我:

Error tokenizing data. C error: Expected 3 fields in line 196, saw 4 
+0

你什麼意思都不工作......'skiprows = 196'意思是跳過第196行,'skiprows = [196,203]'意思是跳過第196行和第203行......你可能需要看看pre-處理您的數據以獲得合適的質量。 – AChampion

+0

當我嘗試:df = pd.read_csv('items_sch_1.csv',skiprows = [196,203])我得到:rror標記數據。 C錯誤:預計在196行中有3個字段,見過4個字段 –

回答

3

如果你只是想跳過所有壞線,你可以用

df = pd.read_csv('file_1.csv', error_bad_lines=False) 

這將載入您的CSV打印每一行跳過的警告,以便知道有多少錯誤。