2012-12-15 103 views
13

我想提取使用斯坦福CoreNLP(或其他工具)的兩個實體之間的完整關係。提取斯坦福核心實體之間的關係核心NLP

例如:

的Windows是的Linux更受歡迎。

此工具需要 Java。

足球是世界上最流行的遊戲

什麼是最快的方法?那麼最佳做法是什麼?

在此先感謝

+0

嘿,是否有任何能夠將文本轉換爲主語謂詞對象三元組的NLP庫? –

回答

5

您可能正在尋找名詞之間的依賴關係。斯坦福分析器提供這樣的輸出。看看here。您可以將皮特所說的(即POS圖)與依賴圖結合起來,以確定一對名詞(或名詞短語)與哪些關係(例如直接對象或名詞性主語等)共享。

3

因此,您正在尋找連接名詞短語的動詞短語。這在斯坦福核心NLP中實際上很簡單。只需通過管道運行並遍歷POS圖即可獲得您想要的結果。你將不得不想出處理複雜句子的方法,當然你會想要使用共同參考系統來處理照應。

這是不平凡的,所以你可以將你的問題稍微分解爲一個可以回答的問題?如果你的問題是,這是可能的嗎?那麼答案是肯定的。如果是「我該怎麼做?」那麼我建議你開始使用系統並自己回答這個問題。

+0

你叫什麼POS圖? – mbatchkarov

+0

(ROOT (S (NP(PRP $我的)(NN狗)) (ADVP(RB也)) (VP(VBZ喜歡) (S (VP(VBG吃) (S (ADJP (NNS bananas)))))) (。))) –

+6

這不是一個分析樹嗎? – mbatchkarov

8

ReVerb重點關注打開IE。您可以先閱讀他們的紙張「Identifying Relations for Open Information Extraction」並檢查demo網站開始。

+0

紙張的鏈接可能已經死了,你能再次檢查嗎? – Bhashithe

+0

完成更新鏈接。 –

+0

我已經在Python中用一個簡單的例子來說明如何使用這些PoS標籤來提取關係:http://davidsbatista.net/blog/2017/05/08/ReVerb/ –

0

這是Stanford Relation Extractor這是coreNLP管道的一部分。它由「關係」指定,並且至少依賴於「ner」和「parse」,即命名實體識別和解析器註釋器。

相關問題