0
我有這些變量:Unicode轉換串來串
s1 = '\xd1\x98\xd1\x83\xd0\xbd'
s2 = u'\xd1\x98\xd1\x83\xd0\xbd'
我怎樣才能變換不定s2
是相同s1
,這樣比較兩個將返回True
。
我有這些變量:Unicode轉換串來串
s1 = '\xd1\x98\xd1\x83\xd0\xbd'
s2 = u'\xd1\x98\xd1\x83\xd0\xbd'
我怎樣才能變換不定s2
是相同s1
,這樣比較兩個將返回True
。
您可以轉換s1
是一樣s2
:
s1 = '\xd1\x98\xd1\x83\xd0\xbd'
s2 = u'\xd1\x98\xd1\x83\xd0\xbd'
s1 = s1.decode('unicode-escape')
哎呀,找到正確的答案在這裏,解決了這個問題:http://stackoverflow.com/questions/11174790/convert-unicode-string字符串但是,爲什麼我應該編碼爲Latin-1時,文本是西里爾文?或者更好,爲什麼's2.encode('windows-1251')'工作? – user2136786
這在我看來是UTF-8,'u'\ u0458 \ u0443 \ u043d'','јун'。 –
這已張貼在Stackoverflow。 Check here:http://stackoverflow.com/questions/11174790/convert-unicode-string-to-byte-string – vkrams