2015-05-15 73 views
0

我正在尋找基於規則的方法或任何其他方法來識別文本中的所有提及。我發現有幾個庫提供了相關性,但沒有提及的唯一選項。我要的是類似下面的東西:如何識別文字中的提及?

輸入文本:

[這個畫家]的視覺幻想,以及不同的歷史建築風格升值的放縱,可以在他的1840建築師的夢想可見。經過一系列關於莫希幹人的繪畫的繪畫,[他]在1829年做了三年的歐洲之旅,但[他]以四年前的一次旅行聞名於世,他在哈得遜河卡茨基爾山脈。 FTP,名字[The Oxbow的這位畫家]和生命之旅系列。

*方括號突出顯示提及。

如何找到提及?另外,它與共同點有什麼不同?如果有人可以張貼有關論文的鏈接,這將是非常有益的。

回答

1

我想你可以從標準的dcoref註釋器中得到你想要的。查看此註釋器設置的註釋,CorefChainAnnotation。這是從文檔實體到「coref鏈」的映射。

每個CorefChain都可以按照文本順序爲您提供相關實體的提及列表。