2014-04-21 35 views
0

我想知道在處理德文,日文,韓文和Java語言中的特殊字符(如β)時是否存在問題C.問題在java.text.Normalizer.Form.Form.NFD和utf8 proc之間編碼C

我們在java方面使用java.text.Normalizer.Form.NFD並將字符串傳遞給DB,我們在C中有自定義函數來規範化字符串。我們遇到了具有攀登和特殊字符的名稱問題。例如:如果名稱有ÄßÜ,則在將數據庫標準化後,將其更改爲用於標準化的C函數中的「assu」。

這是用UTF8的問題在C或爲它是Java和C正規化functions.How之間的不匹配,我們應該處理這些特殊字符..

+0

什麼是「ust8proc」或「UTF8proc」? –

+0

這是一個錯字和它的UTF8proc – user3556364

+0

這個函數從哪裏來?它不是(據我所知)在標準C庫中。 –

回答

0

嘗試使用Normalizer.Form.NFC或Normalizer.Form .NFKC,你可以找到更多的信息here