2010-04-21 21 views

回答

10

在UTF-16中它將是兩個字節,而在UTF-32中它將是4個字節。

畢竟,否則您無法區分編碼值剛好是以零字節開始的字符和代表U + 0000的單個零字節。

基本上UTF-16以2個字節的塊爲單位工作,而UTF-32以4個字節的塊爲單位工作。 (不可否認,對於字符以外的BMP,您需要UTF-16的兩個「塊」,但原理仍然相同)。如果您要實現UTF-16解碼器,則一次只能讀取兩個字節。