2013-06-21 31 views
0

我有這些變量:Unicode轉換串來串

s1 = '\xd1\x98\xd1\x83\xd0\xbd' 
s2 = u'\xd1\x98\xd1\x83\xd0\xbd' 

我怎樣才能變換不定s2是相同s1,這樣比較兩個將返回True

+0

哎呀,找到正確的答案在這裏,解決了這個問題:http://stackoverflow.com/questions/11174790/convert-unicode-string字符串但是,爲什麼我應該編碼爲Latin-1時,文本是西里爾文?或者更好,爲什麼's2.encode('windows-1251')'工作? – user2136786

+0

這在我看來是UTF-8,'u'\ u0458 \ u0443 \ u043d'','јун'。 –

+0

這已張貼在Stackoverflow。 Check here:http://stackoverflow.com/questions/11174790/convert-unicode-string-to-byte-string – vkrams

回答

3

您可以轉換s1是一樣s2

s1 = '\xd1\x98\xd1\x83\xd0\xbd' 
s2 = u'\xd1\x98\xd1\x83\xd0\xbd' 

s1 = s1.decode('unicode-escape')