2014-03-13 123 views

回答

0

UTF-8使用不同數量的字節,具體取決於表示的字符。第一個字節使用7位ASCII約定來實現向後兼容。其他字符(如中文標誌)最多可佔用4個字節。

正如維基百科中的鏈接文章所述,您引用的字符位於3個字節值的範圍內。

2

0xFFFF具有11111111 11111111的位模式。根據UTF-8規則分割比特,模式變爲1111 111111 111111。現在添加UTF-8的前綴位,模式變爲*1110*1111 *10*111111 *10*111111,這是0xEF 0xBF 0xBF,又名239 191 191,又名-17 -65 -65,採用二進制補碼格式(這是Java用於簽名值--Java沒有無符號數據類型)。