2016-10-31 81 views
2

我是一位使用Python和NLTK進行NLP操作的新手。從不同的句子開始,我想知道如何從句子中提取某些依賴關係。如何使用NLTK從句子中提取特定信息

例如: 愛德華有一個黑色外套和白色的鞋子搭配紅色鞋帶

使用詞性標註我可以提取語音的某些部分,但我想特別提取他有,例如,黑色外套,最終列出的信息等:

名稱:愛德華

服裝:黑色外套

鞋:白鞋搭配紅色鞋帶

+1

你能告訴我們你的代碼爲POS標記和輸出嗎? –

回答

2

你要尋找的是NER(命名實體識別)。由於每個句子結構都不相同,所需的信息也不同,因此您可能需要自己製作模板或工作示例here

還有大量的語料庫可供您使用。

+0

那麼可以根據我正在嘗試的POS標籤創建自己的語法正則表達式。感謝您及時的回覆。 – Boyos123

1

你可以把這個問題看成是提取關係元組,可能是二元關係。在這種情況下,你需要知道約open IE。在這種情況下,您可以提取關係元組,如或。如果你有監督數據,你可以建立你自己的關係抽取模型。否則,使用NER或POSTagging等其他技術不容易提取姓名,服裝或其他重要信息。

一種替代方式可以是依賴性分析,但我不知道如何建模它以適應您的特定需求。