2013-02-03 34 views
-2

Unicode字符可以有重複的字節「塊」嗎?Unicode 2字節重複

例如:存在於兩個字符

 -------- 
0xc3 | 0xa0 | 
0xc2 | 0xa0 | <- SAME byte 
    -------- 

0XA0,所以我的問題是,是否有字符誰包含2個相同的字節:

  ------------ 
      | 0xc2 0xa0 | 
0xZZ 0xYY | 0xc2 0xa0 | <- SAME 2 bytes 
      ------------ 
+2

這似乎並不是真正的問題,由於評論「所以如何檢查某個unicode字符?我怎麼知道這個字符有多大?「以及這個問題中的混淆。 (Unicode字符不是「有字節」的,一個字符可以用不同的方式編碼爲字節,而你似​​乎對UTF-8和UTF-16感到困惑。)請描述你正試圖解決的問題。 –

回答

1

是的,當然。只需諮詢您最喜愛的Unicode數據庫。例如,這裏是U+A0A0

大部分的基本平面的密集使用,所以你會發現很多的代碼點,其值是形式ñ   × +   ň的。

+0

那麼如何檢查某個unicode字符?我怎麼知道char有多大?導致Unicode字符可以在1到4個字節之間。 – d3L

+0

@ user2005038:這是不正確的。我建議你多學習一些與Unicode有關的東西。每個人都會引用一個着名的文檔,我相信很快就會有評論出現。 –

+2

@ user2005038:嗯,[這裏是](http://www.joelonsoftware.com/articles/Unicode.html),但我沒有真正閱讀它,不知道它是否有用。 (儘管我知道一些人對喬爾的看法。)你也可以參考[維基百科](http://en.wikipedia.org/wiki/Unicode)。 –