我解碼字符串「öçÇşŞükrÜ」到其他一些字符集。Python編碼解碼如何
我遇到了一些有趣的問題,並想了解我如何解決它。
>>> "öçÇşŞükrÜ".decode("utf-8")
u'\xf6\xe7\xc7\u015f\u015e\xfckr\xdc'
>>> "öçÇşŞükrÜ".decode("utf-8").encode("utf-8")
'\xc3\xb6\xc3\xa7\xc3\x87\xc5\x9f\xc5\x9e\xc3\xbckr\xc3\x9c'
>>> import chardet
>>> chardet.detect('\xc3\xb6\xc3\xa7\xc3\x87\xc5\x9f\xc5\x9e\xc3\xbckr\xc3\x9c')
{'confidence': 0.99, 'encoding': 'utf-8'}
>>> chardet.detect("öçÇşŞükrÜ")
{'confidence': 0.99, 'encoding': 'utf-8'}
什麼我不明白,找不到是如何找回原來的字符串「öçÇşŞükrÜ」與Python中的解碼和編碼過程?
閱讀[絕對最小每個軟件開發人員絕對,積極必須知道Unicode和字符集(沒有藉口!)](http://www.joelonsoftware.com/articles/Unicode.html)。 Python文件應該用ASCII編寫(儘管如果你設置了編碼,你可以輸入Unicode字符)。 – katrielalex
以前已經討論過很多次了。最好的資源:https://www.youtube.com/watch?v=sgHbC6udIqc – deceze