我有一個csv文件,其中4行格式完全相同。當用熊貓閱讀csv時,它不會讀取所有的行。我無法弄清楚爲什麼?因爲格式是相同的.Plz的幫助。列舉如下:read_csv停止讀取一些行,儘管使用相同的格式
tmp_csv_outfile:
6801 2017/09/28 18:56:51.390624 129.1972 107 XXX1 YYYY ZZZZ 908 log warn verbose 1 908 :: 235 :: [tp]0022 > f4 37 3e 00 00
6802 2017/09/28 18:56:51.390640 129.1972 108 XXX1 YYYY ZZZZ 908 log warn verbose 1 908 :: 235 :: [tp] TEST: ~Finished Testcase: TEST0471
6803 2017/09/28 18:56:51.390646 129.1973 109 XXX1 YYYY ZZZZ 908 log warn verbose 1 908 :: 235 :: [dia] trigger received - resetting session timeout 5000
6804 2017/09/28 18:56:51.390652 129.1975 110 XXX1 YYYY ZZZZ 908 log info verbose 1 908 :: 235 :: [dia][th1] Diagnosis Core responded, sending to the th1 Adapter (allConnected = 0)
df = pd.read_csv(tmp_csv_outfile,names=["Data"],header=None,sep='\s\s+$',engine='python')
print df.tail(3)
輸出
Data
0 6801 2017/09/28 18:56:51.390624 129.1972 107 X...
1 6802 2017/09/28 18:56:51.390640 129.1972 108 X...
SOLUTIONSOVLED
長挖我找到了解決辦法,在 https://github.com/pandas-dev/pandas/issues/16893
大熊貓的更新後後它開始工作正常。感謝@ jezrael提供寶貴意見。
如果使用'sep ='|''或者'sep ='¥''仍然存在問題? – jezrael
但我沒有其他sep patterns.It幾乎所有的線路都行,發生了什麼情況在這裏第二行。如果我將其更改爲最後一行,那麼它工作正常。還是我理解你錯了? – Biswal
是的,問題在於數據 - 你的數據在'235 ::'之後是網狀的,所以看起來數據與另一行連接在一起或行被移除...我的解決方案不起作用? – jezrael