2011-07-30 53 views
3

我有兩個來自Google Chrome拼寫檢查程序(基於hunspell)的BDIC(二進制字典?)文件。我想將這兩個文件合併成一個單獨的BDIC用於所有單詞。將來自Chrome(hunspell)的兩個BDIC文件合併爲一個

這裏是一個reader/writer這種格式由鉻源(LGPL/C++)

如何可以組合兩個文件用C++或命令行(鉻/ SRC/THIRD_PARTY /的hunspell /谷歌/ bdict_reader.h)效用?

+0

最近的Chrome/Chromium版本(47+)將同時使用多種語言進行拼寫檢查。 – osgx

回答

3

合併兩個hunspell字典很容易,有像https://github.com/arty-name/hunspell-merge這樣的工具可以幫助您合併任意數量的源詞典。

創建bdict Chrome瀏覽器可以識別的文件比較棘手。 Chrome使用此格式進行優化,並在內部使用convert_dict工具將affdic文件轉換爲bdict。我無法在線找到此工具,因此只剩下一個選項,從Chromium資源中構建它。谷歌有一個非常簡單的設置,如果仔細執行,可以讓你構建這個工具。首先,您必須按照http://dev.chromium.org/developers/how-tos/get-the-code獲取代碼並根據您的平臺設置您的環境。之後執行ninja -C out\Debug convert_dict,如果完成沒有錯誤,請在out/Debug文件夾下找到您的convert_dict可執行文件。

您無法將自定義語言添加到Chrome(據我所知),因此您必須替換其中一個預定義語言。我建議安裝一種你不明白的語言,並將它用於合併的語言。您可以在Chrome用戶個人資料文件夾中找到bdict文件。

+0

自定義語言不是必需的,但Vivaldi瀏覽器向Blink引擎添加了其他幾種語言。我只想合併我每天使用(寫)的兩種語言。鉻代碼是否包含aff和dic文件來生成字典? – osgx

+0

是的,它包含它們作爲第三方模塊的依賴。 –

相關問題