我有兩個UTF-8字節\xf0\x9f\x93\xb1\xf0\x9f\x9a\xac
,我想它像\xf0\x9f\x93\xb1
分裂,\xf0\x9f\x9a\xac
是什麼做到這一點從一個分裂兩個UTF-8字節的有效途徑另一個
我做什麼最有效的方法現在是\xf0
問題
如果我解碼分裂和重新編碼,它由bigOTHER的建議我拿錯字節後面
>>> s ='\xf0\x9f\x93\xb1\xf0\x9f\x9a\xac'
>>> u = s.decode("utf-8")
>>> u
u'\U0001f4f1\U0001f6ac'
>>> u[0].encode("utf-8")
'\xed\xa0\xbd'
>>> u[1].encode("utf-8")
'\xed\xb3\xb1'
>>> u[0]
u'\ud83d'
>>> u[1]
u'\udcf1'
解決:
這是因爲我的Python是編譯UCS2代替UCS4而前者是默認的。欲瞭解更多信息請檢查該Question
什麼是您的電腦本地? –
@ bigOTHER呃..那是什麼意思? – Harwee
lang_country.encoding –