2013-03-26 120 views
3

我有一個看起來像這樣的字符串。Unicode編碼/解碼

st = '/M\xe4rzen' 

我想將這個轉化爲unicode。我怎樣才能做到這一點?我已經試過:

st.decode('utf-8') 
unicode(t, 'utf-8') 

原始文件是UTF-8編碼,但我似乎無法得到字符串的Unicode表示。

回答

11

您的數據不是UTF8編碼;越有可能是使用Latin-1編碼:

>>> print st.decode('latin1') 
/Märzen 

調用.decode()就足夠了,沒必要呼叫unicode()