我有一個單詞列表,我希望標記器將它們全部標記爲名詞。有沒有辦法實現這一點?如何將我的字典添加到斯坦福標記器?
回答
您需要使用自定義字典來訓練您的標記器(我有一個單詞列表,我希望標記器將它們全部標記爲名詞)。要做到這一點,你必須改變.props文件。道具文件包含標籤使用的選項。
在道具文件您有更改培訓文件。 你可以得到更多的細節HERE
trainFile = custome標記,dictionary.appropriateExtension
但我的名單並不是很大。我如何根據現有的標記器來訓練標記器?或者我可以在哪裏獲得用於訓練現有標記器的語料庫?這樣我可以添加我自己的單詞。 –
檢查您的.props文件,您將獲得現有語料庫文件的名稱 – swapnil7
是的,我已經看到了文件名。但我不知道他們在哪裏。例如,'/u/nlp/data/chinese/ctb7/train.mrg'在哪裏? –
- 1. 標記輸入斯坦福解析器
- 2. 斯坦福分析器 - 標記計數
- 3. 斯坦福POS機標記器如何完成標記化?
- 4. 如何使用斯坦福分析器獲取POS標記
- 5. 如何導入斯坦福POS標記器
- 6. 斯坦福標記者NullPointerException異常
- 7. 將斯坦福C++庫添加到Visual Studio 2015
- 8. 斯坦福Maxenttagger與斯坦福分析器
- 9. Maven爲斯坦福CoreNLP和斯坦福分析器構建
- 10. 斯坦福NLP POS標註器(MaxentTagger)
- 11. 如何在斯坦福NLP中擴展/修改字典?
- 12. 斯坦福NER
- 13. 如何使用斯坦福解析器
- 14. 斯坦福分析器:frenchFactored.ser.gz
- 15. 斯坦福解析器
- 16. 從NLTK內訓練新的斯坦福詞性標記器
- 17. 斯坦福POS標記器的POS直方圖
- 18. 斯坦福解析器輸出到SVG
- 19. 中文標記器斯坦福核心nlp
- 20. 斯坦福解析器標記與金融工具
- 21. 使用API訓練和重新訓練斯坦福標記器
- 22. NLTK無法找到斯坦福POS標記模型文件
- 23. 如何將我們訓練的數據添加到現有斯坦福NER分類器中?
- 24. 我如何擴展斯坦福coreNLP西班牙語模型/字典
- 25. 如何爲斯坦福標記器創建自己的訓練語料庫?
- 26. 如何讓NER和POS使用斯坦福CoreNLP標記預標記文本?
- 27. 如何找到斯坦福NLP命名實體的指標
- 28. 在斯坦福解析器中添加一種語言
- 29. Photomania-斯坦福保羅赫加蒂的
- 30. 斯坦福NLP的Java
退房這個https://mailman.stanford.edu/pipermail/java-nlp-user/2012-June/002204。 html – swapnil7
感謝您的回覆。但我並不是說分割,事實上我已經分割了它。我的問題是如何給一個特定單詞列表的標籤? –