在Unicode中組合字符需要什麼？

當單個代碼點映射到符號就足夠了時，在Unicode中具有符號的組合字符表示的實際應用是什麼？在Unicode中組合字符需要什麼？

它給了我們什麼編程/非編程優勢？

2014-10-04 batman

標準化是一種情況 – 2014-10-04 23:15:07

當存在預先呈現的呈現時，例如當使用分解呈現（基本字符和組合字符）時，沒有特別的編程優點。使用U + 0065 U + 0065拉丁文小字母E U + 0301組合急性ACCENT而不是U + 00E9拉丁文使用急性「é」的小字母E.這種分解的演示文稿需要在編程中處理，這是問題的一部分，而不是優點。所以這與詢問在字符代碼中使用字母U的好處類似。

爲什麼在實際數據中使用分解的演示文稿（或字母U）並需要處理的原因是編程的外部因素，因此在SO中是無關緊要的。

分解全部可分解字符在處理中可能具有優勢，因爲它使得數據更加統一，規範。這將涉及所需處理的某些特定功能，並且可以通過執行（通常使用庫例程）對NFD或NFKD格式進行歸一化來實現。但這通常是處理過程的一部分，而不是輸入格式的一部分。如果執行了一些字符串匹配，則最好將字符的分解和預分解表示看作是等價的，而規範化使得這很容易。但是，這是一種處理兩種不同表示的方式，而不是它們存在的原因，並且同樣可以通過對NFC進行規範化來執行（即，預分解可以預分解的所有內容）。請參閱Unicode FAQ部分Normalization。

來源

2014-10-05 12:51:53

在Unicode中組合字符需要什麼？

回答

相關問題