0

據我所知,斯坦福NER有3,4和7個級別的模型(或標籤)。 我需要一個具有超過7個標籤(例如13個標籤)的命名實體識別器的標準和Java實現。我不想自己開發它,我需要它是準確的。有沒有滿足這些條件的NER?NER的標籤數量

感謝

+0

問題,要求我們建議還是找一本書,工具,軟件庫,教程或其他異地資源是題外話了堆棧溢出,因爲他們傾向於吸引自以爲是的答案和垃圾郵件。相反,請描述問題以及到目前爲止解決問題所做的工作。 – BadZen

回答

1

斯坦福NER系統可以接受再培訓的任何數量的標籤。 3,4和7級模型只是預先訓練好的模型。如果你想在更多課程上進行培訓,你必須收集培訓數據,並重新訓練模型。

0

Python nltk package提供了命名實體識別(NER),它有一個in build分類器。它有超過7班。這是

ORGANIZATION - Georgia-Pacific Corp., WHO 
PERSON - Eddy Bonte, President Obama 
LOCATION - Murray River, Mount Everest 
DATE - June, 2008-06-29 
TIME - two fifty a m, 1:30 p.m. 
MONEY - 175 million Canadian Dollars, GBP 10.40 
PERCENT - twenty pct, 18.75 % 
FACILITY - Washington Monument, Stonehenge 
GPE - South East Asia, Midlothian 

您使用Java,所以在java等效包是OpenNLP。您可以在OpenNLP中查看分類器。

這裏是SO link這證明OpenNLP相當於nltk