摩西文檔（統計機器翻譯）mose.ini文件格式？

摩西有沒有moses.ini格式的文檔？在沒有參數的情況下在命令行運行moses會返回可用的功能名稱，但不會返回可用參數。此外，.ini文件的結構沒有在我能看到的手冊中指定。摩西文檔（統計機器翻譯）mose.ini文件格式？

2015-05-04 Kwame

其主要思想是該文件包含將由翻譯模型使用的設置。因此，應在摩西特徵規格中查找moses.ini中的值和選項的文檔。

這裏是我在網上找到的關於moses.ini的一些摘錄。

在Moses Core，我們有一些細節：

7.6.5 moses.ini
所有功能函數都在[feature]部分指定。它應該是格式爲：
* Feature-name key1=value1key2=value2 ....
例如，KENLM factor=0 order=3 num-features=1 lazyken=0 path=file.lm.gz

此外，還有關於如何打印約在moses.ini提到的所有組件的基本統計信息的提示。

運行腳本
analyse_moses_model.pl moses.ini
這可能是有用的設置映射步驟的順序，以避免翻譯選項爆炸或只是爲了檢查模型組件是一樣大/詳細，我們預期。

在Center for Computational Language and EducAtion Research (CLEAR)維基，還有一些文檔的示例文件：

參數

建議作出.ini文件存儲所有的設置。

input-factors
- 使用因子模型或不
mapping
- 要使用在存儲器（T）LM或讀取硬盤直接（G）
ttable-file
文件 - 說明NUM。的來源因素，數量。（0：SRILM，1：IRSTLM），使用因子編號，順序（n-gram），指示使用LM的類型（0：SRILM，1：IRSTLM） LM，和路徑語言模型文件

的。如果這還不夠，對this page, see "Decoder configuration file" section

的部分 [ttable-file]和[lmodel-file]包含指向樂句表格另一種描述文件和語言模型文件，分別。您可以忽略這些行上的號碼。目前，只需知道 語言模型規範中最後一個數字是n-gram模型的順序。

該配置文件還包含一些功能權重。請注意， ,[weight-t]部分有5個權重，每個特徵包含短語表中的。

通過訓練過程創建moses.ini文件不會不加修改與您的解碼器工作，因爲它依賴於未編入我們的解碼器語言模型庫。爲了使能夠正常工作，請打開moses.ini文件，並在[lmodel-file]標題後緊接的行中找到語言模型規範。這條線上的第一個數字將是0，它代表SRILM。將其更改爲8，並保持行的其餘部分不變。然後你的配置應該工作。

來源

2015-05-12 23:06:00

翻譯表的其他文檔可以在這裏找到：http://www.statmt.org/moses/?n=FactoredTraining.ScorePhrases – Kwame

摩西文檔（統計機器翻譯）mose.ini文件格式？

回答

相關問題