2017-06-08 88 views
-1

我正在處理其他人在Excel中被篡改的CSV文件,因此以某種方式在文件末尾包含其他逗號(分隔符)中間文件和不完整行。忽略尾部逗號中間文件,忽略尾部不完整行

自然熊貓/ Python的CSV閱讀器無法處理這些文件。

我想知道是否有人知道現有的解決方案是爲了解決這些煩人的功能。我很欣賞從頭開始編寫解決方案的非常重要的建議。

舉例說明:

CSV file contents: 

header1, header2 
1,1 
2,3 
5,8,, 
1 
1 
+1

什麼內容應該是什麼? – stamaimer

回答

0
def preprocess(filename): 
    with open(filename, 'r', encoding="utf-8") as csvfile:  
     for line in csvfile.readlines[1:]: 
      if ',' in line: 
       yield list(map(int, line.split(',')[0:2]))