Unicode編碼/解碼

我有一個看起來像這樣的字符串。Unicode編碼/解碼

st = '/M\xe4rzen'

我想將這個轉化爲unicode。我怎樣才能做到這一點？我已經試過：

st.decode('utf-8') 
unicode(t, 'utf-8')

原始文件是UTF-8編碼，但我似乎無法得到字符串的Unicode表示。

您的數據不是UTF8編碼;越有可能是使用Latin-1編碼：

>>> print st.decode('latin1') 
/Märzen

調用.decode()就足夠了，沒必要也呼叫unicode()。

2013-03-26 12:47:25

回答