0
我有一個字節串b"\xDF"
。當我嘗試將其解碼爲UTF-8時,會拋出一個UnicodeDecodeError。解碼到CP1252工作正常。在兩個字符集中,0xDF都由字符「ß」表示。那麼爲什麼錯誤?以UTF-8爲什麼我不能將 xDF(ß)解碼爲UTF-8?
>>> hex(ord("ß"))
'0xdf'
>>> b"\xDF".decode("utf-8")
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xdf in position 0: unexpected end of data
>>> b"\xDF".decode("cp1252")
'ß'
哦,當然。謝謝。 – Daniel