除去非ASCII感染行我有一個非常大的CSV文件看起來像這樣:如何在我的CSV
關鍵字,展示
descargar JUEGOS免費,951
ãƒ'ã,½ã,³ãƒ³kakaku COM,451
企業會議,155個
租車,356
智能,1224
吉他譜,064
è<±è¯ç¿»E」,160
我已經閱讀了文件轉換成一個字典,像這樣:
# Read the CSV
filename = argv[1]
csvfile = open(filename, 'r')
csvreader = csv.DictReader(csvfile)
rows = []
for row in csvreader:
rows.append(row)
我將如何刪除與非ASCII字符的行,這樣我只結了:
關鍵字,展示
descargar JUEGOS免費,951
企業會議,155個
租車,356
智能,1224
吉他譜,064
簡而言之:如果行中存在任何非ASCII字符,則必須刪除整行。
謝謝!
...爲什麼不把它正確解碼爲UTF-8呢? – 2011-04-13 22:44:14
另請參閱:https://github.com/jdunck/python-unicodecsv – 2011-04-13 22:50:06