在Python 2.7版我有這樣的:的UnicodeDecodeError: 'UTF-8' 編解碼器不能解碼字節 「0xc3」
# -*- coding: utf-8 -*-
from nltk.corpus import abc
with open("abc.txt","w") as f:
f.write(" ".join(i.words()))
我再試試這個文檔中在Python 3閱讀:
with open("abc.txt", 'r', encoding='utf-8') as f:
f.read()
只能得到:
File "C:\Python32\lib\codecs.py", line 300, in decode
(result, consumed) = self._buffer_decode(data, self.errors, final)
UnicodeDecodeError: 'utf8' codec can't decode byte 0xc3 in position 633096: invalid continuation byte
我做錯了什麼? Notepad ++似乎表明該文檔是Unicode utf-8。即使我嘗試用Notepad ++將文檔轉換爲這種格式,我仍然在python 3中得到這個錯誤,這很奇怪,因爲我讀了很多其他的utf-8編碼文檔沒有任何問題。
「od」對該位置周圍的角色說了什麼? –