2013-04-13 64 views
4

我想從句子中提取從屬子句,主要子句,關係子句,限制性關係子句,非限制性關係子句,但我不知道如何完成這項工作。例如:提取條款形式句子

「我第一次在巴黎見過她,我住在九十年代初。」
[主要條款] [親屬條款]

「她伸出受傷的手。
[主條款] [限制性關係條款]

請幫我做這個工作嗎?

回答

3

您應該能夠通過選區分析來提取此信息(達到合理的準確度)。有許多實現列出了here。對於該列表,我會添加我自己的,可供下載here。 t比任何其他可用的高精度解析器都快,而且記錄合理(針對研究代碼)。

+1

感謝您的回答。我閱讀斯坦福解析器的文檔,但我不知道如何編寫一個程序來獲得主句,......從句子中。請給我一個指導如何讓你的語法分析器或其他語言獲得Java中的主句子......。 – SahelSoft

+1

在Penn Treebank註釋樣式中,子句通常標記爲'S'。樹頂部的'S'節點通常是主要的子句,任何包含的'S'節點都是子節點。當然,這是由碎片(FRAG)和其他相關標籤(SBAR,SBARQ等)混淆。您需要查看賓州樹庫註釋指南,並針對您認爲應用程序的「主要」和「附屬」標籤創建自己的啓發式。 – AaronD