摩西有沒有moses.ini格式的文檔?在沒有參數的情況下在命令行運行moses會返回可用的功能名稱,但不會返回可用參數。此外,.ini文件的結構沒有在我能看到的手冊中指定。摩西文檔(統計機器翻譯)mose.ini文件格式?
回答
其主要思想是該文件包含將由翻譯模型使用的設置。因此,應在摩西特徵規格中查找moses.ini
中的值和選項的文檔。
這裏是我在網上找到的關於moses.ini
的一些摘錄。
在Moses Core,我們有一些細節:
7.6.5 moses.ini
所有功能函數都在[feature]
部分指定。它應該是格式爲:
* Feature-name key1=value1
key2=value2
....
例如,KENLM factor=0 order=3 num-features=1 lazyken=0 path=file.lm.gz
此外,還有關於如何打印約在moses.ini提到的所有組件的基本統計信息的提示。
運行腳本
analyse_moses_model.pl moses.ini
這可能是有用的設置映射步驟的順序,以避免翻譯選項爆炸或只是爲了檢查模型組件是一樣大/詳細,我們預期。
在Center for Computational Language and EducAtion Research (CLEAR)維基,還有一些文檔的示例文件:
參數
建議作出
.ini
文件存儲所有的設置。
input-factors
- 使用因子模型或不
mapping
- 要使用在存儲器(T)LM或讀取硬盤直接(G)
ttable-file
文件 - 說明NUM。的來源因素,數量。 (0:SRILM,1:IRSTLM),使用因子編號,順序(n-gram),指示使用LM的類型(0:SRILM,1:IRSTLM) LM,和路徑語言模型文件
的。如果這還不夠,對this page, see "Decoder configuration file" section
的部分
[ttable-file]
和[lmodel-file]
包含指向樂句表格另一種描述文件和語言模型文件,分別。您可以忽略這些行上的 號碼。目前,只需知道 語言模型規範中最後一個數字是n-gram模型的 順序。該配置文件還包含一些功能權重。請注意, ,
[weight-t]
部分有5個權重,每個特徵包含短語表中的 。通過訓練過程創建
moses.ini
文件不會不加修改與 您的解碼器工作,因爲它依賴於未編入我們的解碼器語言 模型庫。爲了使 能夠正常工作,請打開moses.ini文件,並在[lmodel-file]
標題後緊接的行中找到語言模型 規範。 這條線上的第一個數字將是0
,它代表SRILM。 將其更改爲8
,並保持行的其餘部分不變。然後你的 配置應該工作。
- 1. 將文檔從西班牙文翻譯成英文並保留格式
- 2. 翻譯模塊不會翻譯文檔
- 3. 錯誤編譯摩西。沒有dist文件夾或moses.ini文件
- 4. 如何設計文檔文件格式?
- 5. 谷歌文檔住翻譯
- 6. 幫忙翻譯will_paginate文檔?
- 7. 計算機翻譯
- 8. 通過機器翻譯系統生成英文查詢
- 9. CouchDB設計文檔格式
- 10. 使用MOSES統計機器翻譯從印地語到英語
- 11. Drupal翻譯文件
- 12. Kohana翻譯文件
- 13. Magento翻譯文件
- 14. 角翻譯文件
- 15. 翻譯PHP文件
- 16. angular-translate在翻譯文件中翻譯
- 17. 以正確的格式翻譯阿拉伯文到英文系統
- 18. 機器人操作系統(ROS)文檔
- 19. 正在尋找一個文件文件系統或歸檔文件格式
- 20. Django I18n翻譯整個文檔
- 21. 如何添加文檔的翻譯
- 22. 用於文檔語言翻譯的API
- 23. 如何翻譯和修改map.resources:文檔
- 24. 重量輕的HTML解析器翻譯成格式文本?
- 25. 從拉丁文翻譯成英文的C#翻譯器
- 26. 乳膠文檔字統計
- 27. 文檔格式
- 28. 格式檔案文件名
- 29. A.R.文本翻譯器android
- 30. 翻譯源文件爲SVF格式 - 轉換失敗
翻譯表的其他文檔可以在這裏找到:http://www.statmt.org/moses/?n=FactoredTraining.ScorePhrases – Kwame