transliteration

    0熱度

    2回答

    我正在使用ICU4C來音譯CJK。我想知道是否有可能在ICU中進行分詞,將中文文本分割成按照某些分詞標準定義的單詞序列。 當我嘗試音譯例如: 直接輸出html代碼而不是作爲函數返回值代後處理 使用 Transliterator* myTrans = Transliterator::createInstance("zh-Latin",UTRANS_FORWARD, err);

    16熱度

    2回答

    從1600萬字符串變量的矢量中刪除德語(或法語)口音的最佳方法是什麼? 例如, '乾燥綜合徵' 變成 '斯耶格倫氏綜合徵' Converstion單個字符的成單個字符是更好然後音譯如 ä=> AE O => OE U => UE。 例如,使用正則表達式將是一個選項,但有更好的選擇(R包)。 gsub('ü','u',gsub('ö','o',"Sjögren's syndrome (über) "

    6熱度

    1回答

    我需要做一些相當簡單的事情,但沒有哈希映射硬編碼。 我有一個字符串s,它在西里爾文我需要某種例子,如何使用一種自定義過濾器將它變成拉丁字符排序(給一個純粹的拉丁例子,不要混淆任何人如果字符串s = sniff;我希望它能夠查找嗅探並將它們變成其他東西(可能還有組合) 我可以看到ICU4j可以做這種事情,但我不知道如何實現它,因爲我找不到任何工作示例(或我只是愚蠢)。 任何幫助表示讚賞。 感謝 最好

    1熱度

    1回答

    所以,我想爲我的許多地區預加載音譯規則。我已經列入我的初始化文件(應用程序/配置/初始化/ locales.rb)一個下面的代碼: I18n.backend.store_translations(:en, :i18n => { :transliterate => { :rule => { "а" => "a", "б" => "b" } } })

    -1熱度

    1回答

    La> ila> ha illAlla> hu wah} dahu> la> shari> ka lahu,lahul mulku wa lahul h} amdu,wa huwa'ala> kulli shai'in nadir。 這是ayah的音譯。使用的字體是Times New Arabic。應用此字體後,我沒有看到任何更改。像「>」這樣的字符沒有消失。任何解決方案

    0熱度

    1回答

    這是我的代碼: <?php $dom = new DOMDocument(); $dom->load('http://services.gisgraphy.com/geoloc/search?lat=22.298569900000000000&lng=70.794301799999970000&radius=7000', true); $dom->save('filename.xml');

    2熱度

    2回答

    爲了索引和搜索的目的,我需要「平整」一些Unicode字符串。例如,我需要將GötheФ€轉換爲ASCII。最後兩個字符在ASCII中沒有關閉表示,因此可以完全丟棄它們。因此,我從 echo iconv("UTF-8", "ASCII//TRANSLIT//IGNORE", "GötheФ€"); 想到的是Gothe而是它輸出Gothe?EUR。 除了字母之外,我還希望所有各種各樣的Unico

    0熱度

    1回答

    我正在使用dyve自動完成 jquery插件。插件工作得很好,但是當我嘗試做一些音譯插件不起作用。 一些細節: * 來自數據庫的結果總是在西里爾 *。當用戶開始輸入西里爾一切正常OK.But當用戶開始在拉丁美洲打字,在後端的在提交給數據庫之前,拉丁文字符會轉換爲西里爾文字符。 然後結果像往常一樣返回到前端,但沒有顯示。 有人知道如何使這項工作? 在此先感謝

    -1熱度

    3回答

    我是編程新手,我正在嘗試理解音譯 - 就像Google輸入工具一樣,它允許用戶從一種語言鍵入另一種語言。 音譯如何工作?具體而言,如果我正在從英語翻譯成印地語或英語翻譯成俄羅斯語,我是否需要爲英語,印地語和俄語編寫詞彙詞典? 是否有人知道任何教程顯示如何編寫音譯代碼?我試過尋找,但沒有運氣。 此外,代碼必須在JavaScript/JQuery(客戶端代碼)?我的項目是Python/Django。我

    0熱度

    1回答

    我試圖將這行烏爾都語轉換爲拉丁語,然後將拉丁字符轉換爲ASCII(通過刪除重音符等),但它似乎缺少一些字符。 爲什麼還有非拉丁字符(「ہ」,「ے」等)? $ uconv -x 'Any-Latin' دفعہ 1: تمام انسان آزاد اور حقوق و عزت کے اعتبار سے برابر پیدا ہوۓ ہیں۔ انہیں ضمیر اور عقل ودیعت ہو