0
我有一個文本文件,其中包含unicode字符串「aBiyukwawa」,「varcasÙva」等。當我嘗試在Python解釋器中使用以下代碼解碼它們時,它工作正常並解碼到u'aBiyuk\xd9wa'
:UnicodeDecodeError在Python與編解碼器模塊
"aBiyukÙwa".decode("utf-8")
但是從文件的Python程序使用codecs
模塊下面的代碼,當我讀到它,它拋出一個UnicodeDecodeError
。
file = codecs.open('/home/abehl/TokenOutput.wx', 'r', 'utf-8')
for row in file:
以下是錯誤消息:
UnicodeDecodeError: 'utf8' codec can't decode byte 0xd9 in position 8: invalid continuation byte
任何想法是什麼原因造成這種奇怪的行爲?
◎在ISO8859- [1,3,10,14-16]中是0xD9。 – geoffspear
CP1252也是如此。 –