2015-01-04 85 views
-4

爲什麼瞭解ASCII和Unicode字符集之間的區別很重要?ASCII和Unicode區別

我瞭解到ASCII是用於8位字節的字符集,而Unicode的當前版本6.3有100萬個代碼,其中0.1被分配給字符。

但知道差異的重要性是什麼?

我只在json解析期間指定字符集或網站的元數據規範,而不知道它的真正意義。

+0

我使用unicode進行編碼,因爲我可以通過將所述整數編碼爲十六進制值然後unicode來輕鬆地在字符和整數之間切換。 我不知道你是否可以用ASCII做同樣的事情,也許你可以,誰知道。如果不是,那麼這就是O :)「加密」和「編碼」可以用整數數學而不是ASCII字符數組完成的一個原因。 –

+0

與度量單位和英制度量單位類似,您不需要知道差異,只需使用您需要的單位即可。 (而且,它不太可能是ASCII碼,即使在MS-DOS的程序集編程中,也不會使用它,Windows不會,大多數C庫不會; HTML不會,Java不會。 .NET不支持......) –

+0

「這並不困難」 - [絕對最低限度的每個軟件開發人員都必須積極地瞭解Unicode和字符集(無藉口!)](http://www.joelonsoftware。 com/articles/Unicode.html),但如果您在閱讀後有問題,請提問。 –

回答

2

ASCII被定義爲7位代碼,其值高達0x7F。 ASCII是其中一個Unicode字符塊的嚴格子集。

Unicode可以用於在許多不同的書寫系統中編碼許多不同的字符,並具有數百萬個定義的字符。它通常用可變長度編碼表示。 UTF-8是西方語言最流行的編碼。

按照設計,ASCII已被編碼爲UTF-8,因此將一段ASCII文本標記爲UTF-8將不會引起任何問題。

警告:許多人將ASCII與許多使用字符值大於127的「擴展ASCII」字符集混淆。擴展ASCII不是UTF-8。