2016-09-13 55 views
-2

我面臨着同樣的問題,因爲 Stanford CoreNLP OpenIE annotator 我嘗試輸出= nlp.annotate(S,性能= { 「註釋」: 「記號化,SSPLIT,POS,depparse,natlog,openie」, 「OUTPUTFORMAT」 :「json」,「openie.triple.strict」:「true」,「openie.max_entailments_per_clause」:「1」,「openie.splitter.disable」:「true」})StanfordCoreNLP openIE問題

但是我仍然得到4個子句(u'are'從'',u''20%電動機',u'assembly線')(u'are'從''u'percent電動機',u'assembly線')(u''從''''''''''''''''')''''''''''''''''是',你百分之二十的電動機','你')(你是','電動機',''''')' 我做錯了什麼?如何獲得精確三聯 ('從','百分之二十電動機','裝配線')

+0

瞭解到這是預期行爲後,我寫了一些腳本來過濾掉其他關係中包含的關係。謝謝你的答案Gabor Angeli – Prathamesh

回答

1

這實際上是預期的行爲。這是OpenIE系統中的一個設計決策,即使它們是冗餘的,也可以產生邏輯上由原始語句引起的所有三元組。我們的想法是,這些三元組通常用於類似於IR-ish查找的事情,並且在這些情況下,不必進行模糊匹配,以確定是否有任何三元組與查詢「足夠相似」。