2012-04-01 58 views
7

想知道是否有任何工具可以幫助我在文本中檢測代詞的名稱。檢測代詞及其名詞?

Jone is Spanish. He can speak German. 

我如何標記HeJone

回答

12

您試圖解決的問題被稱爲anaphora resolution。執行此任務的java工具可用here。源代碼在該站點上提供。關於它是如何工作的理論看看,請查看由Lappin和Leass從1994年開始的this paper.

+1

它是唯一可以做照應解析的工具。有沒有其他工具可用.. – 2012-04-01 08:18:34

+1

@ user1234770沒有,有很多。如果您想深入瞭解豐富的api,那麼stanford javaNLP套件中有一個名爲dcoref的工具。你可以閱讀[這裏](http://nlp.stanford.edu/software/dcoref.shtml)並閱讀javadocs [here](http://nlp.stanford.edu/nlp/javadoc/javanlp/) 。快樂狩獵。 – Cameron 2012-04-01 08:31:49

+1

owky我會,謝謝卡梅隆:) – 2012-04-01 11:35:05

5

您是否在尋找coreference解析工具? 關於一些可用工具,有一個簡短的blog。大部分都是用Java編寫的,如ArkRef,BART,以及斯坦福大學CoreNLP中的一個。

+0

嗨肯尼斯。我曾試過斯坦福大學的CoreNLP,它適用於我,但仍然無法檢測到來自動詞的名稱,例如講師,歌手分機......你認爲其他工具能夠檢測到這些名字! – 2012-04-02 04:19:32

+2

你可以閱讀我的答案爲您的類似問題:http://stackoverflow.com/questions/9561370/how-can-i-differentiate-between-a-persons-name-and-other-names-that-are-derived/9561664#9561664 – 2012-04-02 08:15:30