我想添加新的標記詞(在本地區使用的本地詞)並創建新模型。我從命令行創建了一個.prop文件,但我如何創建一個.tagger文件?我如何在斯坦福Pos tagger中創建我自己的模型?
當我試圖創建這樣的文件在斯坦福大學網站上提到它顯示像
錯誤「沒有指定模型」
什麼-model說法,是它的語料庫?我怎樣才能把我的新標記的單詞添加進去?
那我該如何訓練一個標記器呢?
你需要開始與包含了 惡搞使用選項.props文件。我們用於創建樣本標記器的.props文件包含在模型目錄中;您可以從任何一個 看起來最接近您要標記的語言開始。
例如,要訓練一個新的英文tagger,請從左邊的3個字詞開始,然後在tagger props文件中輸入 。要爲 英語以外的西方語言培訓標記器,可以考慮德語或法語 標記器的道具文件,它們包含在完整版中。對於使用不同字符集的語言 ,您可以從中文或 阿拉伯語道具文件開始。或者,您可以使用-genprops選項至 MaxentTagger,它將編寫一個樣本屬性文件,其中包含 文檔,供您修改。它將它寫入標準輸出,所以你要 想通過重定向輸出(通常用>)將它保存到某個文件中。 行開頭的#使事情發表評論,因此您需要 刪除您希望指定的屬性之前的#。
這是唯一的描述我從斯坦福大學網站得到的,任何一個以前做過?幫幫我? – 2014-11-23 06:30:34
目前尚不清楚你的問題在哪裏。我們無法判斷您是否真的擁有.props文件或者是否發現了需要解決的錯誤/問題。從斯坦福網站粘貼文本不會帶來更多幫助;恰恰相反。 – Alfabravo 2014-11-23 06:42:15
我想添加新的標記詞(我們地區使用的本地詞)並且想要創建新模型.i從命令行創建.prop文件,但我如何創建.tagger文件?當我試圖創建斯坦福網站上提到的這樣的文件時,它顯示「沒有指定模型」這樣的錯誤 - 什麼是模型參數,它是否是語料庫?我怎樣才能把我的新標記的單詞添加進去? 。我認爲現在的問題是清楚的? – 2014-11-24 08:26:17