1
代碼示例:保存線由pd.read_csv跳過到一個單獨的數據幀
data = 'a,b,c\n1,2,3\n4,5,6,7\n8,9,10'
pd.read_csv(StringIO(data), error_bad_lines=False)
Skipping line 3: expected 3 fields, saw 4
我想這裏是讓跳過線,並將其保存在其他地方像另一個數據幀或陣列。
我實際處理的每個文件的長度約爲8K行,4至12列,跳過的行有一些我不想丟失的信息。
我試圖用
try:
pd.read_csv(StringIO(data), error_bad_lines=False)
except(pd.parser.CParserError)
如何抓住 「壞線」?
文件之一:http://www.pjm.com/pub/account/loadhryr/1998.txt
謝謝你非常感謝你的幫助! 「名稱」方法適用於具有相同格式的文件,而原始數據文件的格式發生變化(列數增加,因此Bad行數),我必須手動調整要讀取的所有名稱的長度數據。我想知道是否有一種方法可以自動調整名稱參數,或者我只是設置了一個足夠大的範圍,如100。 再次,非常感謝您的幫助! – user3735277