我是新來的NLP場景,並且正在使用OpenNLP 1.5
入門。 https://opennlp.apache.org/documentation/manual/opennlp.html
(我使用命令行界面上手)自定義NER模型 - 失敗
我以前已經提供的樣品模型,使用不同的工具進行試驗和:
我通過一些文件在這裏給出的命令去最後決定創建一個定製NER型號。
我遵循上述鏈接給出的指示。
複製給到.train
文件樣本句子(我簡單地創建具有該擴展名的新文件,並粘貼內容到它):
<START:person> Pierre Vinken <END> , 61 years old , will join the board as a nonexecutive director Nov. 29 .
Mr . <START:person> Vinken <END> is chairman of Elsevier N.V. , the Dutch publishing group .
我用下面的命令來使模型:
bin/opennlp TokenNameFinderTrainer -model en-ner-person2.bin -lang en -data en-ner-person2.train -encoding UTF-8
問題是,即使該模型正在創建,它似乎不能正常工作。使用新創建的模型進行測試: bin/opennlp TokenNameFinder en-ner-person2.bin
但是,當我輸入Pierre Vinken
時,它不會被識別爲人。我也嘗試從.txt
文件創建具有完全相同內容的模型,但也失敗了。
我在做什麼錯?
TIA。
輸入「Pierre Vinken」時會得到什麼結果?你嘗試過輸入完整的句子嗎? – NBartley
@NBartley電流輸出只是「Pierre Vinken」。我想' Pierre Vinken '。 –
@NBartley我還沒有試過完整的句子。當我用已有的樣本模型試用Pierre Vinken時,我得到了預期的輸出。 –