2011-05-14 24 views

回答

5

你的問題實際上是兩個問題:如何使用GATE找到命名實體,也許如何嵌入GATE到你的應用。

命名實體識別或分類是一個巨大的研究領域,取決於你想要找到的命名實體,不同的方法可能是最有效的。 GATE提供了一個非常基本的地名詞典列表和基於規則的方法,用於查找英文文本中某些命名實體的類別:ANNIE。 如果ANNIE發現的類別對您來說很有意思,那麼啓動的一種方法可能是瞭解並改進ANNIE提供的內容。 ANNIE管道將爲您的文檔中的Person,Organization等創建註釋,您只需使用或編寫一個PR來訪問這些註釋,並根據這些註釋的功能或文本執行您所需的任何操作。 查看GATE手冊http://gate.ac.uk/sale/tao/split.html它解釋了ANNIE,並且還有一些關於如何嵌入GATE的文檔(如何在不運行GUI的情況下直接從Java程序使用GATE)。