2010-12-02 146 views
1

我想弄清楚如何在python中使用unicode支持; 我想這個字符串轉換爲Unicode: 「ABCDE」 - > 「\ X00A \ x00B \ x00C \ x00D \ x00E」python unicode支持

任何內置functionnality能做到這一點,或將我使用加盟()?

謝謝!

回答

5

這是UTF-16BE,不是Unicode。

>>> 'ABCDE'.decode('ascii').encode('utf-16be') 
'\x00A\x00B\x00C\x00D\x00E' 
+0

你爲什麼要放入`.decode('ascii')`位?它的含義是`.encode('utf-16be')`('''xff'.encode('utf-16be')`將失敗,UnicodeDecodeError ascii編解碼器錯誤與''xff'解碼錯誤.decode ('ascii')`will) – 2010-12-02 02:20:02

+1

@Chris:爲了讓讀者清楚它必須被解碼*以某種方式*。 – 2010-12-02 02:21:32

2

理解python unicode的關鍵是unicode意味着UNICODE。一個unicode對象是對字符的理想表示,而不是實際的字節。

0

str對象應該首先通過解碼方法轉換爲unicode對象。 然後使用帶有所需字符編碼的編碼方法將unicode對象轉換爲str對象。