我試圖從句子中提取關係(三元組),並試圖手動篩選斯坦福大學CoreNLP的依賴關係分析,並以此方式提取主 - 動 - 對象關係。從依賴關係樹中提取關係
問題是你超越簡單的一句話現在「我很高興」,同位語短語,ccomp
和xcomp
複合動詞和連詞conj
,發現關係變得更加複雜。
例如:「我的老師,鮑勃是一個偉大的老師」(我的老師,是偉大的老師)&(我的老師,是鮑勃)
「我的朋友和我不喜歡跑步或跳躍「。 (我的朋友,不喜歡,跑步)&(我的朋友,不喜歡,跳躍)&(我,不喜歡,跑步)&(我,不喜歡,跳躍)
斯坦福大學對於這些場景,OpenIE確實不能很好地工作(它很好地解決了第一個例子,但第二個例子沒有得到任何關係)。
我的問題是:是否有任何開源的Java庫可以執行這種關係提取 - 直接從文本或從依賴分析?
我確實來過:https://github.com/knowitall/ollie看起來非常有前途 - 然而Ollie是嚴格禁止用於商業用途的,我需要能夠在將來使用該庫用於商業用途。
另一個想法:我不是很熟悉的機器學習技術 - 但我在想,我能以某種方式通過了一句與我期望的產出一些ML模型訓練算法的依賴解析如圖所示在上面的例子中,並訓練一個可以爲我進行關係抽取的模型?
請注意,」 問題要求我們建議還是找工具,庫或最喜歡的非現場資源是堆棧溢出的主題,因爲它們傾向於吸引自以爲是的答案和垃圾郵件。相反,請描述問題以及到目前爲止解決問題所做的工作。「要求圖書館這樣做是無關緊要的,但是,將樹結構轉換爲基於RDF的表示形式並不困難。已經編寫了一些代碼來啓動這個過程,詢問它將會是主題。 - 請參閱http://stackoverflow.com/questions/22831474/triple-extraction-from-a-sentance?rq=1 – fnl