2014-02-18 120 views
0

我正在使用斯坦福從文章中刪除身份。命名實體識別

它正在檢測像Werner這樣的名字。但印度人的名字如ram,shyam等未被發現。

我應該怎麼做才能讓他們辨認。

回答

1

你應該訓練NER印度人的名字。我找不到如何實現這一點的詳細信息。但是這個FAQ頁面(http://nlp.stanford.edu/software/crf-faq.shtml#a)有一些信息可能是您的起點。特別是問題2-3與你的問題直接相關。

+0

你提供的信息很有用。但我不想從一開始就訓練分類器。我想在現有的分類器文件中添加一些印度名稱。 –