2016-03-23 91 views
1

我試圖從句子中提取關係(三元組),並試圖手動篩選斯坦福大學CoreNLP的依賴關係分析,並以此方式提取主 - 動 - 對象關係。從依賴關係樹中提取關係

問題是你超越簡單的一句話現在「我很高興」,同位語短語,ccompxcomp複合動詞和連詞conj,發現關係變得更加複雜。

例如:「我的老師,鮑勃是一個偉大的老師」(我的老師,是偉大的老師)&(我的老師,是鮑勃)

「我的朋友和我不喜歡跑步或跳躍「。 (我的朋友,不喜歡,跑步)&(我的朋友,不喜歡,跳躍)&(我,不喜歡,跑步)&(我,不喜歡,跳躍)

斯坦福大學對於這些場景,OpenIE確實不能很好地工作(它很好地解決了第一個例子,但第二個例子沒有得到任何關係)。

我的問題是:是否有任何開源的Java庫可以執行這種關係提取 - 直接從文本或從依賴分析?

我確實來過:https://github.com/knowitall/ollie看起來非常有前途 - 然而Ollie是嚴格禁止用於商業用途的,我需要能夠在將來使用該庫用於商業用途。


另一個想法:我不是很熟悉的機器學習技術 - 但我在想,我能以某種方式通過了一句與我期望的產出一些ML模型訓練算法的依賴解析如圖所示在上面的例子中,並訓練一個可以爲我進行關係抽取的模型?

+0

請注意,」 問題要求我們建議還是找工具,庫或最喜歡的非現場資源是堆棧溢出的主題,因爲它們傾向於吸引自以爲是的答案和垃圾郵件。相反,請描述問題以及到目前爲止解決問題所做的工作。「要求圖書館這樣做是無關緊要的,但是,將樹結構轉換爲基於RDF的表示形式並不困難。已經編寫了一些代碼來啓動這個過程,詢問它將會是主題。 - 請參閱http://stackoverflow.com/questions/22831474/triple-extraction-from-a-sentance?rq=1 – fnl

回答

0

鑑於您已經擁有(或可以構建)依賴關係樹,並且需要在商業環境中使用,我認爲手動編碼特殊情況規則來創建三元組是最容易的,例如,用於處理連接詞在你的例子中,看看這對你是否足夠好[1]。

除「斯坦福OpenIE」,還有更多的網絡規模開關係抽取公開信息提取(雖然我更喜歡更準確的術語[謂語]三聯提取)研究周圍[2, 3],最值得注意的是ReVerb [4]本身(來自與Ollie一樣的KnowItAll根,BTW),但這也是嚴格的非商業性的...

但是,引用類似的問題回答: 「」請注意,「要求我們推薦或找到工具,圖書館或最喜歡的非現場資源的問題與Stack Overflow無關,因爲它們傾向於吸引自以爲是的答案和垃圾郵件。相反,請描述問題以及迄今爲止解決問題所做的工作。「要求圖書館做到這一點是無關緊要的。「」 「

[1] http://www.nist.gov/tac/publications/2013/participant.papers/UWashington.TAC2013.proceedings.pdf

[2] http://www.cs.washington.edu/research/projects/aiweb/media/papers/etzioni-ijcai2011.pdf

[3] http://nlp.stanford.edu/pubs/2015angeli-openie.pdf

[4] http://reverb.cs.washington.edu/