2015-04-08 41 views
1

目前我是摩西的新手,並且已經培訓了一些在網站上提供的樣本數據集。 我在尋找更多的數據集來訓練系統。 這些可在網上? 在Google上搜索時應該注意什麼?摩西培訓數據 - 對話

回答

4

你可以找到幾個語料庫:http://opus.lingfil.uu.se

此外,一些開源的應用包括他們的雙語PO文件,但你必須檢查許可證。

我的建議是建立一個垂直(即特定領域)的MT系統,而不是通用的系統,以獲得更好的結果。所以這個決定會影響你選擇的語料庫。

我希望這有助於!