我和我的朋友正在開發一個iPhone和Android應用程序。我們需要使用文字轉錄。我們應該選擇什麼編碼(甚至是特殊字體)來在我們的應用程序中顯示正確的單詞轉錄?什麼編碼我應該選擇轉錄?
更新(2011年12月14日):我想提供更多信息。我嘗試閱讀穆勒詞典(http://sourceforge.net/projects/xdxf/files/dicts-XDXF/sdict05/comn_sdict_axm05_mueller24.tar.bz2/download)的一些抄寫,並且遇到了一些字符問題。 我檢查的字典文件的編碼與enca
~/mueller24 % enca dict.xdxf
Universal transformation format 8 bits; UTF-8
一個有問題的單詞是「畫家」。當我在Emacs打開字典文件我看到:
隨着數據的工作我們寫在Ruby腳本。它從字典中解析這個轉錄並將其存儲在數據庫中。之後,它從數據庫轉錄出來並將其作爲json寫入文件(utf-8)。如果我打開文本編輯器,這個文件我看到它,因爲這串\u0445peInt\u255a
如果我解析它在我的應用程序,並顯示在屏幕上好像是:
哪裏錯了嗎?我想解析字典文件的問題。比如何正確解析它?
也許UTF-16? – aroth
單詞轉錄如何與其他文本不同? – SLaks
請參閱我的詳細更新。謝謝 – yas375