在ASCII中,字符<被編碼爲單字節字符0x3C,我想知道的是有沒有一個字符集,其中<的編碼方式不同?我試過UTF-8,它是一樣的。我試過GB2312,它是一樣的...在所有字符編碼中,ASCII字符是否總是以相同的方式編碼?
另一個問題,所有字符集中的所有ASCII字符都是相同的嗎?
在ASCII中,字符<被編碼爲單字節字符0x3C,我想知道的是有沒有一個字符集,其中<的編碼方式不同?我試過UTF-8,它是一樣的。我試過GB2312,它是一樣的...在所有字符編碼中,ASCII字符是否總是以相同的方式編碼?
另一個問題,所有字符集中的所有ASCII字符都是相同的嗎?
ASCII的前127個字符在所有ASCII派生字符集中都是相同的。它們在非ASCII字符集(例如EBCDIC)中不相同。
代碼> 127的字符根據代碼頁和/或編碼的不同而不同。
在UTF-16中,'abc'被編碼爲'0 97 0 98 0 99',這與ASCII非常相似,但是如果試圖將其解釋爲ASCII,那麼您最終會得到一個額外的NUL字符(或之後,取決於字節順序)每個字符。沒有太大的區別,但足以讓它們不可互換。
不,有一些非官方的區域變體ISO-646其中differ quite a lot from ASCII。
'abc'在UTF-16中也可以是'97 0 98 0 99 0'。您需要一個BOM來確定字節序。 – jmucchiello 2009-11-21 12:23:51
其實,你不需要物料清單 - 它完全是可選的。您也可以選擇從編碼數據外部存儲此信息以及編碼信息。這不是推薦的方式,但絕對不一定要有BOM。 – 2009-11-21 12:28:07