2015-05-04 43 views

回答

1

其主要思想是該文件包含將由翻譯模型使用的設置。因此,應在摩西特徵規格中查找moses.ini中的值和選項的文檔。

這裏是我在網上找到的關於moses.ini的一些摘錄。

Moses Core,我們有一些細節:

7.6.5 moses.ini
所有功能函數都在[feature]部分指定。它應該是格式爲:
* Feature-name key1=value1key2=value2 ....
例如,KENLM factor=0 order=3 num-features=1 lazyken=0 path=file.lm.gz

此外,還有關於如何打印約在moses.ini提到的所有組件的基本統計信息的提示。

運行腳本
analyse_moses_model.pl moses.ini
這可能是有用的設置映射步驟的順序,以避免翻譯選項爆炸或只是爲了檢查模型組件是一樣大/詳細,我們預期。

Center for Computational Language and EducAtion Research (CLEAR)維基,還有一些文檔的示例文件:

參數

建議作出.ini文件存儲所有的設置。

input-factors
- 使用因子模型或不
mapping
- 要使用在存儲器(T)LM或讀取硬盤直接(G)
ttable-file
文件 - 說明NUM。的來源因素,數量。 (0:SRILM,1:IRSTLM),使用因子編號,順序(n-gram),指示使用LM的類型(0:SRILM,1:IRSTLM) LM,和路徑語言模型文件

的。如果這還不夠,對this page, see "Decoder configuration file" section

的部分 [ttable-file][lmodel-file]包含指向樂句表格另一種描述文件和語言模型文件,分別。您可以忽略這些行上的 號碼。目前,只需知道 語言模型規範中最後一個數字是n-gram模型的 順序。

該配置文件還包含一些功能權重。請注意, ,[weight-t]部分有5個權重,每個特徵包含短語表中的 。

通過訓練過程創建moses.ini文件不會不加修改與 您的解碼器工作,因爲它依賴於未編入我們的解碼器語言 模型庫。爲了使 能夠正常工作,請打開moses.ini文件,並在[lmodel-file]標題後緊接的行中找到語言模型 規範。 這條線上的第一個數字將是0,它代表SRILM。 將其更改爲8,並保持行的其餘部分不變。然後你的 配置應該工作。

+0

翻譯表的其他文檔可以在這裏找到:http://www.statmt.org/moses/?n=FactoredTraining.ScorePhrases – Kwame