我正在修改一個Perl腳本,它以製表符分隔的格式讀取一系列UCS-2LE編碼文件,但是當字符串包含擴展拉丁字符集之外的字符時,我無法分離製表符上的字符串。 下面是我從這些文件中讀取(製表符分隔)的樣本行: adını transcript asr turkish
當我有我的劇本寫這幾行輸出文件,試圖調試這個問題,這是它正在寫的: ad1Ů1ĉtranscript asr turkish
它
我正在閱讀某人的代碼,我試圖看到代碼如下。 根據評論,這個功能是Convert a UCS character to an UTF-8 string。但什麼是ucs字符,將ucs轉換爲unicode的規則是什麼,我可以在哪裏找到這些文檔? /*
* Convert a UCS character to an UTF-8 string
*
* Returns the string length