2009-11-21 88 views

回答

6

ASCII的前127個字符在所有ASCII派生字符集中都是相同的。它們在非ASCII字符集(例如EBCDIC)中不相同。

代碼> 127的字符根據代碼頁和/或編碼的不同而不同。

1

在UTF-16中,'abc'被編碼爲'0 97 0 98 0 99',這與ASCII非常相似,但是如果試圖將其解釋爲ASCII,那麼您最終會得到一個額外的NUL字符(或之後,取決於字節順序)每個字符。沒有太大的區別,但足以讓它們不可互換。

+1

'abc'在UTF-16中也可以是'97 0 98 0 99 0'。您需要一個BOM來確定字節序。 – jmucchiello 2009-11-21 12:23:51

+1

其實,你不需要物料清單 - 它完全是可選的。您也可以選擇從編碼數據外部存儲此信息以及編碼信息。這不是推薦的方式,但絕對不一定要有BOM。 – 2009-11-21 12:28:07