2011-07-04 53 views
0

我有一個文本文件,其中包含unicode字符串「aBiyukwawa」,「varcasÙva」等。當我嘗試在Python解釋器中使用以下代碼解碼它們時,它工作正常並解碼到u'aBiyuk\xd9wa'UnicodeDecodeError在Python與編解碼器模塊

"aBiyukÙwa".decode("utf-8") 

但是從文件的Python程序使用codecs模塊下面的代碼,當我讀到它,它拋出一個UnicodeDecodeError

file = codecs.open('/home/abehl/TokenOutput.wx', 'r', 'utf-8') 
for row in file: 

以下是錯誤消息:

UnicodeDecodeError: 'utf8' codec can't decode byte 0xd9 in position 8: invalid continuation byte 

任何想法是什麼原因造成這種奇怪的行爲?

回答

5

您的文件不以UTF-8編碼。找出它編碼的,然後用它。

+1

◎在ISO8859- [1,3,10,14-16]中是0xD9。 – geoffspear

+1

CP1252也是如此。 –

相關問題