0
我學習處理數據別人的代碼,並在此行得到了錯誤:編碼和解碼UTF-8和latin1的
chars_sst_mangled = ['à', 'á', 'â', 'ã', 'æ', 'ç', 'è', 'é', 'í',
'í', 'ï', 'ñ', 'ó', 'ô', 'ö', 'û', 'ü']
sentence_fixups = [(char.encode('utf-8').decode('latin1'), char) for char in chars_sst_mangled]
的錯誤消息是
"UnicodeDecodeError: 'ascii' codec can't decode byte 0xc3 in position 0: ordinal not in range(128)"
我不知道有什麼問題在這裏,以及如何解決它?
看來你在python 2.X中運行這個代碼片段。由於'encode()'方法用於將unicode轉換爲字節,並且您試圖將字節序列(編碼字符)轉換爲字節python引發此錯誤,爲解決此問題,您可以使用'decode() '方法,將字符串(原始8位值)轉換爲unicode。 – Kasramvd