2016-03-22 46 views
2

我遇到這篇文章http://swrc.kaist.ac.kr/paper/171.pdf,它描述了從依賴樹中提取三元組的方法。這個結果正是我想要的。然而這篇論文只提到它是一個「後期樹遍歷」。是否有任何開源實現提取三元組?例如,「VRLA於2016年在洛杉磯舉行。」應當生成和「VRLA,在洛杉磯舉行的」「VRLA,舉行,在2016年」依賴樹到三元組

回答

1

你可以試着考慮看看斯坦福OpenIE系統(CoreNLP的一部分):

new Sentence("VRLA is held at Los Angeles in 2016").openieTriples(); 

這應該爲(VRLA;在洛杉磯舉行)和(VRLA;在2016年舉行)產生三倍。有關使用的更多文檔可以在OpenIE Annotator page上找到。更一般地說,有許多OpenIE系統可供您查看。 Ollie也許是華盛頓大學最突出的。

+0

OpenIE似乎非常有限。我試圖做與OP非常相似的事情 - 基本上從文本中提取三倍,但也保留所有其他信息,如副詞,形容詞,並將它們作爲修飾詞添加到單詞中。但斯坦福大學的OpenIE確實效果不佳。 「我跑得快。」沒有任何關係。還有其他商業可用的信息提取器是否比斯坦福更強大? Ollie看起來不錯 - 但沒有商業許可證。 – abagshaw

+1

我認爲你所描述的是一個依賴分析。 OpenIE將提取主語/動詞/賓語三元組,並保留參數的依賴關係結構(從中可以提取副詞和形容詞)。上述步驟與AMR或依賴關係解析類似。順便說一句,「我跑得快」不應該提取任何三元組:「快」是一個修飾詞,而不是關係「跑」的對象。 –

+0

是的,我的錯。我想它無法在修改器快速運行的情況下返回雙重本壘打。但沒關係。另一個更復雜的例子。 「我的同學們對演講很感興趣。」返回大量的三元組,並且與OpenIE協同工作 - 但是當我將其更改爲「我的同學對演示文稿不感興趣」時。只是簡單地添加 - OpenIE分崩離析,不會返回任何內容。所以我同意AMR這樣的東西,我認爲是我正在尋找的東西。你知道用於Java的AMR的任何開源庫嗎? – abagshaw