2012-04-16 78 views
4

我可以用下面的代碼得到一個用命名實體註釋的字符串。斯坦福NER:提取單獨的實體列表?

String NEString = classifier.classifyWithInlineXML(fileContents) 

我不知道是否有打電話讓我能得到獨立的實體(個人,組織,LOCATIOIN)列表文件中的任何方法,這樣我就不必解析檢索到的字符串上面的方法來獲取實體列表?

回答

3

在我看來,在cleanes方式來運行的分類是:

List<Triple<String,Integer,Integer>> out = classifier.classifyToCharacterOffsets(text); 
triple.first(): entity type 
triple.second(): start position 
triple.third(): end position 

這組隨之而來的實體,並返回實體的開始和結束位置。

1

據我所知有3種方式來獲得註釋的字符串:

1)classifier.classifyToString(" ")

2)classifier.classifyWithInlineXML(" ")

3)classifier.classifyToString(" ", "xml", true)

第一種是最簡單的獨立。不幸的是,沒有任何方法是你想要的。