2014-10-04 67 views
0

當單個代碼點映射到符號就足夠了時,在Unicode中具有符號的組合字符表示的實際應用是什麼?在Unicode中組合字符需要什麼?

它給了我們什麼編程/非編程優勢?

+0

標準化是一種情況 – 2014-10-04 23:15:07

回答

0

當存在預先呈現的呈現時,例如當使用分解呈現(基本字符和組合字符)時,沒有特別的編程優點。使用U + 0065 U + 0065拉丁文小字母E U + 0301組合急性ACCENT而不是U + 00E9拉丁文使用急性「é」的小字母E.這種分解的演示文稿需要在編程中處理,這是問題的一部分,而不是優點。所以這與詢問在字符代碼中使用字母U的好處類似。

爲什麼在實際數據中使用分解的演示文稿(或字母U)並需要處理的原因是編程的外部因素,因此在SO中是無關緊要的。

分解全部可分解字符在處理中可能具有優勢,因爲它使得數據更加統一,規範。這將涉及所需處理的某些特定功能,並且可以通過執行(通常使用庫例程)對NFD或NFKD格式進行歸一化來實現。但這通常是處理過程的一部分,而不是輸入格式的一部分。如果執行了一些字符串匹配,則最好將字符的分解和預分解表示看作是等價的,而規範化使得這很容易。但是,這是一種處理兩種不同表示的方式,而不是它們存在的原因,並且同樣可以通過對NFC進行規範化來執行(即,預分解可以預分解的所有內容)。請參閱Unicode FAQ部分Normalization

相關問題