我知道bytes.decode
給出了一個字符串,string.encode
給出了字節,但只有在使用正確的encoding
時纔會如此。如何找到python3字節對象的編碼
假設我有使用gb18030
如果我嘗試使用big5
將其解碼編碼的bytes對象:
>>name = '深入 damon'
>>b1 = name.encode('gb18030')
>>> b1.decode('big5')
UnicodeDecodeError: 'big5' codec can't decode byte 0xc8 in position 2: illegal multibyte sequence
有一些方法的編碼可以從bytes
對象可以找到?
我在python3
文檔中找不到任何有用的API。
沒有。如果找到它的一般方法,解碼函數就不需要它的參數。你能得到的最好的是受過教育的猜測。編碼不是包含在字節中的信息的一部分(除非你知道處理自描述數據,如HTML)),它是它的外部屬性。 –