2015-05-06 54 views
1

我有一個單詞列表,我希望標記器將它們全部標記爲名詞。有沒有辦法實現這一點?如何將我的字典添加到斯坦福標記器?

+0

退房這個https://mailman.stanford.edu/pipermail/java-nlp-user/2012-June/002204。 html – swapnil7

+0

感謝您的回覆。但我並不是說分割,事實上我已經分割了它。我的問題是如何給一個特定單詞列表的標籤? –

回答

1

您需要使用自定義字典來訓練您的標記器(我有一個單詞列表,我希望標記器將它們全部標記爲名詞)。要做到這一點,你必須改變.props文件。道具文件包含標籤使用的選項。

道具文件您有更改培訓文件。 你可以得到更多的細節HERE

trainFile = custome標記,dictionary.appropriateExtension

+0

但我的名單並不是很大。我如何根據現有的標記器來訓練標記器?或者我可以在哪裏獲得用於訓練現有標記器的語料庫?這樣我可以添加我自己的單詞。 –

+0

檢查您的.props文件,您將獲得現有語料庫文件的名稱 – swapnil7

+0

是的,我已經看到了文件名。但我不知道他們在哪裏。例如,'/u/nlp/data/chinese/ctb7/train.mrg'在哪裏? –