編碼問題是發展過程中已經咬傷了我次數最多的話題之一。每個平臺堅持自己的編碼,很可能有一些非UTF-8默認值在遊戲中。 (我通常在Linux上工作,默認爲UTF-8,我的同事大多在德語Windows上工作,默認爲ISO-8859-1或一些類似的Windows代碼頁)如何測試正確編碼的應用程序(如UTF-8)
我相信,UTF-8是合適的開發i18nable應用程序的標準。然而,根據我的經驗,編碼錯誤通常很晚才發現(儘管我位於德國,並且我們有一些特殊字符與ISO-8859-1一起提供了一些可檢測的差異)。
我相信,隨着一個完全非ASCII字符集(或那些知道使用此類字符集的語言)的開發者搶得提供測試數據開始。但是,對於我們其他人來說,必須有一種方法來緩解這種情況。
什麼[技術|工具|獎勵]在這裏的人使用?你如何讓你的合作開發者關注這些問題?你如何測試合規性?這些測試是手動還是自動進行的?
添加一個可能的答案前期:
我最近發現fliptitle.com(他們提供了一個簡單的方法來得到奇怪的字符寫入「uʍopǝpısdn」 *)和我打算用它們來提供容易覈查UTF-8字符串(如大多數字符所使用目前在一些奇怪的二進制編碼位置),但有一定必須是更系統的測試中,圖案或用於確保UTF-8兼容性/使用的技術。
注意:即使有一個公認的答案,我想知道更多的技術和模式,如果有一些。如果您有更多想法,請添加更多答案。要選擇一個答案來接受,這並不容易。我選擇了正確性最低的解決問題的正則表達式答案,但也有理由選擇其他答案。太糟糕了,只有一個答案可以接受。
謝謝您的輸入。
*)這是「倒掛」寫「倒掛」對於那些無法看到這些字符由於字體問題
感謝(非常感謝)回答到現在 - 我想保持這個問題開了一段時間積累儘可能多的想法,解決這一問題成爲可能。 – 2009-01-25 21:42:30