2017-01-27 47 views
1

我正在尋找什麼似乎是我的應用程序中的文本編碼問題。我發現一些字符,如U+C5D0U+BE60在FileFormat上顯示爲無效。爲什麼是這樣?他們是否期望與另一個角色結合?爲什麼有些字符「無效」,即使它們顯示在字符串中?

+0

我不太明白這個問題。他們是無效的,時期。 Unicode文檔就是這樣說的。他們在你的應用中以字符串顯示的事實並不能使它們有效,這只是意味着你在某個地方有一個bug。 – sashoalm

+0

@sashoalm你能鏈接到那些Unicode文檔嗎? –

回答

1

它們至少在Unicode 9.0中有效。他們是韓語音節。也許FileFormat引用了一個較舊的規範。見http://www.unicode.org/charts/PDF/UAC00.pdf

+0

codepoints.net認爲它已被添加到2.0版的Unicode ... https://codepoints.net/U+C5D0?lang = en –

+0

@TomHamming所以更可能只是FileFormat的一個錯誤。我查看了所列出的點的頁面,並且有一個「無效」的消息,但是它隨後繼續並描述了該字符。 –

+0

即使FileFormat將這些字符列爲無效字符,它也會將它們列入['HANGUL_SYLLABLES'](http://www.fileformat.info/info/unicode/block/hangul_syllables/index.htm)字符塊中。所以它清楚地知道他們。 –

相關問題