我認爲我主宰了Python 2中的所有Unicode東西,但似乎有些東西我不明白。我從的HTML去我python腳本該用戶輸入:如何將包含unicode字符的字符串轉換爲unicode?
a = "m\xe9dico"
我想這是médico
(也就是醫生)。所以,來轉換爲Unicode我做:
a.decode("utf-8")
或者:
unicode(a, "utf-8")
但這是拋出:
UnicodeEncodeError: 'ascii' codec can't encode character u'\xe9' in position 1: ordinal not in range(128)
如何才能做到這一點?
這已經是unicode。 utf-8版本將是'm \ xc3 \ xa9dico'。 –
@DanielRoseman:在Python 3中,它將是一個unicode文字,但這是Python 2,因此它是8位數據,因此最好是Latin-1。 Ofc這是一個Unicode兼容的編碼,但我認爲誤導只是稱之爲「unicode」。 –