2014-01-27 69 views
0

不共享相同NFC和NFD編碼的unicode字符集是什麼?不具有相同NFD和NFC編碼的unicode字符集

例如日本,在NFD和NFC均爲U '\ u65e5 \ u672c'

然而のご贊同をいただきました

中NFD

:U'\ u306e \ u3053 \ u3099 \ u8cdb \ u540c \ u3092 \ u3044 \ u305f \ u305f \ u3099 \ u304d \ u307e \ u3057 \ u305f '

在NFC:U' \ u306e \ u3054 \ u8cdb \ u540c \ u3092 \ u3044 \ u305f \ u3060 \ u304d \ u307e '''

(NFD和NFC的定義:https://en.wikipedia.org/wiki/Unicode_normalization#Normal_forms

+0

我已經添加了一個解釋NFD和NFC是什麼的維基百科鏈接。隨意用更好的參考替換它。 –

回答

0

NFC是通過首先分解字符串,然後重新組合一些字符序列來執行的。因此,NFC和NFD結果不同的單個字符集是在UCD中具有分解映射的每個字符,並且不是excluded from composition。這些字符也被稱爲primary composites

請注意,這僅適用於單個字符。如果你正在考慮多個角色的序列,事情會變得更加複雜。例如,當分開應用NFC和NFD形式相同時,兩個字符的序列在應用於整個序列時可以具有不同的形式。

相關問題