2016-09-30 94 views
0

我正在嘗試使用自定義NER字典映射文件的斯坦福CoreNLP。這是相當成功的。但是我一直保留默認的斯坦福NER實體,比如我的自定義NER字典中不包含的DATE,NUMBER。可以關閉它嗎?斯坦福CoreNLP刪除NUMBER實體

實施例:豐田阿爾蒂斯2.0(在自定義NER詞典地圖文件中)

斯坦福結果:豐田:NER = ORGANIZATION,阿爾蒂斯:NER =車輛中,2.0:NER = NUMBER

我預期的結果:豐田:NER =組織,阿爾蒂斯:NER =車輛,2.0:NER = 車輛

是否有任何屬性,我可以輸入爲sw癢它生產實體DATE和NUMBER?

提前致謝!

回答

1

我設法解決了這個問題。爲了防止數字和日期相關的實體,您需要設置以下參數在Java代碼:

props.put("ner.useSUTime","false");//do not load the default SUTime models from Stanford 
 
props.put("ner.applyNumericClassifiers","false");//do not use numeric from Stanford

謝謝觀看。