飼餵規則"NFD; [:Nonspacing Mark:] Remove; NFC"
入ICU Transliterator demo,字符Ø
(\u00d8
== LATIN CAPITAL LETTER O WITH STROKE
)保持原樣(即,行程未剝離)。音譯對的Unicode拉丁字母「與中風」
In the list of non-marking spaces(分類Mn
),我找不到任何名爲COMBINING DIAGONAL STROKE
類似的COMBINING SHORT STROKE OVERLAY
(\u0335
)或COMBINING LONG STROKE OVERLAY
(\u0336
)。
但是,我確實發現COMBINING SHORT SOLIDUS OVERLAY
(\u0337
)和COMBINING LONG SOLIDUS OVERLAY
(\u0338
)。它們看起來很相似,但在與o
和O
結合使用時,我的瀏覽器中顯示的線條更粗。
Unicode data I accessed for \u00d8
不提供該角色的分解。
與此同時,該ICU Collator Demo將各自的ø
,o
,Ø
,O
,o\u0337
和O\u0338
整理到使用主(等級= 1 =基本字母)分頁器相同的代碼點。
這是否意味着演示中使用的Collator的語言環境已設置爲以Unicode規範保持沉默的方式標識基本字符?
如果是這樣,如果我想從LATIN [CAPITAL, SMALL] LETTER *
字符的音譯中去掉STROKE,是否需要自定義基於規則的音譯器?
使用LATIN-ASCII轉換絕對比編寫我自己的Tranlsiterator規則更好!謝謝,史蒂文。 –