1
我需要將存儲在字節數組中的UTF-8序列解碼爲字符串。如何許可解碼UTF-8字節數組?
UTF-8序列可能包含錯誤的部分。在這種情況下,我需要儘可能地解碼,並且(可選地)用諸如「?」之類的替換無效部分。
# First part decodes to "ABÄC"
b = bytearray([0x41, 0x42, 0xC3, 0x84, 0x43])
s = str(b, "utf-8")
print(s)
# Second part, invalid sequence, wanted to decode to something like "AB?C"
b = bytearray([0x41, 0x42, 0xC3, 0x43])
s = str(b, "utf-8")
print(s)
在Python 3中實現這一點的最好方法是什麼?