2014-04-15 39 views
0

我對這個話題有點困惑。相同的句子的谷歌結果可能會不同?字符集不斷變化還是什麼?

peоple in thе wоrld 

起初,您可以搜索谷歌firts句子,並查看結果。然後

people in the world 

海棠第二句話,注意不同。

這怎麼可能?

回答

0

如果將其轉儲爲十六進制,則可以看到差異。我只是通過xxd運行它。

第一句:

0000000: 7065 d0be 706c 6520 696e 2074 68d0 b520 pe..ple in th.. 
0000010: 77d0 be72 6c64 0a      w..rld. 

第二句:

0000000: 7065 6f70 6c65 2069 6e20 7468 6520 776f people in the wo 
0000010: 726c 640a        rld. 

這一次似乎是有效的ASCII。

兩者看起來非常相似,但第一句使用Unicode字符集並使用西里爾字符而不是普通的ASCII字符。

+0

對不起,但我沒有得到它。如何將文本翻譯爲十六進制並再次翻譯爲文本並看到不同? – nymfer

+0

人們的「o」與第二句中的「o」不一樣。正在使用的「o」實際上是[unicode西里爾文字母](http://www.fileformat.info/info/unicode/char/43e/index.htm),而不是常規的ASCII「o」。他們看起來非常相似。 –

+0

非常感謝。所以一個小腳本可以做到這一點? – nymfer