我想用pandas read_csv打開一部分csv文件。我打開一節對線746頭,並進入行1120爲什麼pandas read_csv沒有讀取正確的行數?
gr = read_csv(inputfile,header=746,nrows=374,index_col=False)
然後我得到一個錯誤
CParserError: Error tokenizing data. C error: Expected 9 fields in line 1121, saw 17
錯誤是有道理的,因爲在文件的1121行,數據從9個字段變爲17個。沒有任何意義的是它試圖讀取1121行的原因,因爲這些nrows和header應該只能打開多達1120行。
我可以通過減少行數在232以下。即使我增加標題號碼,它仍然有效,因此它開始進一步(例如將其增加到800)。
它將讀取的最後一行看起來沒有什麼特別之處,如果我增加標題號碼,它會在文件中讀取更多行。
我使用Python 2.7和熊貓0.14。
的文件,我想讀的樣子:
"River Levels","GRETA_SOUTH (C)","GLENROWAN (C)","ROCKY_POINT (C)","DOCKER_RD (C)","BOBINAWARRAH (C)","WOOLSHED (C)","WANGARATTA (C)","PEECHELBA_EAST (C)"
41812.00001, 0.70, 0.00, 0.00, 0.20, 0.00, 0.00, 7.30, 125.00
41812.04168, 0.70, 0.00, 0.00, 0.20, 0.00, 0.00, 7.30, 125.00
爲什麼打不開線1121,當NROWS +頭小於這個,它爲什麼會只讀232線它之前這個?
也河水平!一個接近我自己心的話題! (我不能再+1!) – 2014-09-24 05:28:40