2010-10-19 110 views
0

我使用的處理我的文件,並提出優化的輸出的API,但一些特殊字符不會保留,例如:字符編碼問題

輸入:äöü

輸出:äöü

我該如何解決?我應該使用什麼編碼?

非常感謝您的幫助!

+0

請指定語言。 – 2010-10-19 05:06:22

+0

輸入:CSS;輸出:JSON – 3zzy 2010-10-19 05:07:12

+0

這不是一個編程問題? – 2010-10-19 05:10:25

回答

0

它確實取決於您對數據所做的處理。但是總的來說,一個強大的技術是通過Iconv將其轉換爲UTF-8,並通過支持ASCII的API或函數傳遞它。一般來說,如果這些函數不會混淆他們不理解爲ASCII的數據,那麼UTF-8將被保留 - 這是UTF-8的一個很好的屬性。

0

我不知道你所使用的語言,但進入和在讀的時候內容的編碼時,當有內容的編碼之間的不匹配這樣的事情發生。

所以,你可能想要指定準確地讀取數據的編碼。您可能必須與實際編碼玩,你需要使用

string.getBytes("UTF-8") 
string.getBytes("UTF-16") 
string.getBytes("UTF-16LE") 
string.getBytes("UTF-16BE") 
etc... 

而且,做一些研究,什麼地方該數據來自系統。例如,ASP.NET的Web服務將內容作爲UTF-16LE提供,但Java使用UTF-16BE編碼。當這兩個系統以擴展字符相互交談時,他們可能不完全相同地理解對方。