2011-12-14 48 views
-1

我和我的朋友正在開發一個iPhone和Android應用程序。我們需要使用文字轉錄。我們應該選擇什麼編碼(甚至是特殊字體)來在我們的應用程序中顯示正確的單詞轉錄?什麼編碼我應該選擇轉錄?

更新(2011年12月14日):我想提供更多信息。我嘗試閱讀穆勒詞典(http://sourceforge.net/projects/xdxf/files/dicts-XDXF/sdict05/comn_sdict_axm05_mueller24.tar.bz2/download)的一些抄寫,並且遇到了一些字符問題。 我檢查的字典文件的編碼與enca

~/mueller24 % enca dict.xdxf               
Universal transformation format 8 bits; UTF-8 

一個有問題的單詞是「畫家」。當我在Emacs打開字典文件我看到:

enter image description here

隨着數據的工作我們寫在Ruby腳本。它從字典中解析這個轉錄並將其存儲在數據庫中。之後,它從數據庫轉錄出來並將其作爲json寫入文件(utf-8)。如果我打開文本編輯器,這個文件我看到它,因爲這串\u0445peInt\u255a

如果我解析它在我的應用程序,並顯示在屏幕上好像是:

enter image description here

哪裏錯了嗎?我想解析字典文件的問題。比如何正確解析它?

+1

也許UTF-16? – aroth

+0

單詞轉錄如何與其他文本不同? – SLaks

+0

請參閱我的詳細更新。謝謝 – yas375

回答

1

UTF-8(緊湊,向後兼容)

+0

請參閱我的詳細更新。謝謝 – yas375

+1

該文件顯式爲UTF-8(在XML標題中)。從你的屏幕截圖中,畫家的數據看起來不對,我期望它與繪畫相匹配(peɪntə)。我認爲你在這裏有一個合成變音符號。 –

+0

是的,你是對的。我們嘗試在StarDict應用程序中打開此文件,並且這些詞語的轉錄在那裏很好。我只是從那裏複製轉錄字符串到我的文件與json,解析它在iphone應用程序,它顯示正確。我將在Ruby中更深入地分析腳本。感謝您的迴應! – yas375

相關問題