UnicodeDecodeError在Python與編解碼器模塊

我有一個文本文件，其中包含unicode字符串「aBiyukwawa」，「varcasÙva」等。當我嘗試在Python解釋器中使用以下代碼解碼它們時，它工作正常並解碼到u'aBiyuk\xd9wa'：UnicodeDecodeError在Python與編解碼器模塊

"aBiyukÙwa".decode("utf-8")

但是從文件的Python程序使用codecs模塊下面的代碼，當我讀到它，它拋出一個UnicodeDecodeError。

file = codecs.open('/home/abehl/TokenOutput.wx', 'r', 'utf-8') 
for row in file:

以下是錯誤消息：

UnicodeDecodeError: 'utf8' codec can't decode byte 0xd9 in position 8: invalid continuation byte

任何想法是什麼原因造成這種奇怪的行爲？

您的文件不以UTF-8編碼。找出它編碼的是，然後用它。

2011-07-04 20:48:45

◎在ISO8859- [1,3,10,14-16]中是0xD9。 – geoffspear

CP1252也是如此。 –

回答