我正在使用Python 2.7在Python中,「utf8」字符串編碼的類型是什麼?
我正在讀取包含「iso-8859-1」編碼信息的文件。 解析後,我得到的字符串的結果,即s1
:
>>> s1
'D\xf6rfli'
>>> type(s1)
<type 'str'>
>>> s2=s1.decode("iso-8859-1").encode("utf8")
>>> s2
'D\xc3\xb6rfli'
>>> type(s2)
<type 'str'>
>>> print s1, s2
D�rfli Dörfli
>>>
爲什麼是s2
仍然是一個str
調用.encode
後的類型? 如何將它從str
轉換爲utf-8
?
我不熟悉Python,但是你認爲'utf-8'是什麼類型?此外,產量如預期;你還想要什麼? –
此演示文稿可能會幫助您瞭解基本原理:[實用Unicode,或者,我該如何阻止疼痛?](http://bit.ly/unipain)。 –