2017-06-23 49 views
1

我正在研究NLP項目,我需要通過示例說明以下功能。說有句話在句子中找到代詞和名詞之間的關係

告訴山姆,他不得不離開亞瑟,因爲他生病了。

在這份聲明中,第一he必須加以標記,以薩姆和第二he亞瑟。我使用Python工作。關於我可以用來獲得以下功能的任何建議?

+0

請求您添加您嘗試過的代碼。 –

+0

我還沒有寫任何代碼,因爲我不明白我必須使用什麼。我已經看過nltk-chunkers嘗試使用正則表達式<*>將代詞更接近名詞,它們將匹配一個名詞後跟一個代詞。但這在所有情況下都不起作用。 –

回答

2

該任務被稱爲共參照分辨率。爲了解析你提到的那些複雜的案例,你需要使用coreference解析系統,其中大部分(free/OOS)是用Java開發的。有幾種方法可以從Python輕鬆使用它們。其中最知名的是這款Standford CoreNLP包裝:https://github.com/dasmith/stanford-corenlp-python