我工作的一系列解析器在那裏我得到了一堆回溯從我的單元測試一樣的:的Python 3扼流圈CP-1252/ANSI閱讀
File "c:\Python31\lib\encodings\cp1252.py", line 23, in decode
return codecs.charmap_decode(input,self.errors,decoding_table)[0]
UnicodeDecodeError: 'charmap' codec can't decode byte 0x81 in position 112: character maps to <undefined>
的文件與開開()沒有額外的爭論。我可以傳遞額外的參數來打開()或使用編解碼器模塊中的某些內容來打開它們的不同嗎?
這個代碼是用Python 2編寫的,用2to3工具轉換爲3。
更新:事實證明這是一個zip文件喂入解析器的結果。單元測試實際上預計會發生。解析器應該將它識別爲無法解析的東西。所以,我需要改變我的異常處理。在現在這樣做的過程中。
FWIW Latin-1已分配所有256個碼點,因此您永遠不會收到UnicodeDecodeError。但是你可能會破壞你的數據。 – 2010-07-19 22:09:01