如何在吉薩++培訓和測試步驟？

在人工智能方法中，我們有兩個階段的培訓。這些階段是數據和測試。如何在吉薩++培訓和測試步驟？

在培訓階段，我們將大量數據提供給系統，我們通常用較小的數據量進行測試。然後我們評估輸出。

現在的問題是可以通過GIZA ++中嵌入的內置功能來完成這項培訓，或者我們應該爲此編寫一個單獨的應用程序？

如果我們應該寫一個單獨的應用程序，任何人都可以通過建議一個已經寫好的應用程序來幫助我嗎？還是手冊？注：我想有一個對齊程序不是統計機器翻譯

我寧願在吉薩++培訓，所以我可以用未觀測的數據進行測試。

在此先感謝。

2012-08-29 m-Abrontan

那麼，你只是想找到一些數據集來訓練你的模型？爲什麼不使用現有的對齊數據集？ – Daniel

看到這個： http://stackoverflow.com/questions/5752043/is-there-a-tutorial-about-giza – Daniel

這應該是一個很好的起點，使用Moses來培訓基線mt系統。
正常情況下，GIZA ++用於對齊平行語料庫。
您需要一些其他工具，例如IRSTLM，SRILM或KenLM來進行語言模型估計。

2014-07-09 11:21:16

回答