2012-08-29 48 views
31

在人工智能方法中,我們有兩個階段的培訓。 這些階段是數據和測試。如何在吉薩++培訓和測試步驟?

在培訓階段,我們將大量數據提供給系統,我們通常用較小的數據量進行測試。然後我們評估輸出。

現在的問題是可以通過GIZA ++中嵌入的內置功能來完成這項培訓,或者我們應該爲此編寫一個單獨的應用程序?

如果我們應該寫一個單獨的應用程序,任何人都可以通過建議一個已經寫好的應用程序來幫助我嗎?還是手冊? 注:我想有一個對齊程序不是統計機器翻譯

我寧願在吉薩++培訓,所以我可以用未觀測的數據進行測試。

在此先感謝。

+0

那麼,你只是想找到一些數據集來訓練你的模型?爲什麼不使用現有的對齊數據集? – Daniel

+3

看到這個: http://stackoverflow.com/questions/5752043/is-there-a-tutorial-about-giza – Daniel

回答

1

這應該是一個很好的起點,使用Moses來培訓基線mt系統。
正常情況下,GIZA ++用於對齊平行語料庫。
您需要一些其他工具,例如IRSTLM,SRILM或KenLM來進行語言模型估計。