2012-10-03 54 views
1

我試圖獲得一個句子的主要主題,即一個句子在說什麼(不是可能不同的語法主題)。NLP - 句子主語

到目前爲止,我已經得到了

1)OpenNLP在Java是爲了給我一句話檢測,詞性標註,分析,分詞和名稱查找。

2.)MatlParser,斯坦福解析器 - 它可以通過依賴解析給出一個簡單句子的語法主題。

我覺得一個名詞或名詞短語總是會有更廣義的意義,但是一個句子可以有很多名詞和名詞短語。 任何幫助將不勝感激。

回答

7

正如您正確指出的那樣,語法不夠。人們不得不使用某種形式的淺層語義分析來確定你稱之爲「主體」的東西。我相信在SRL(語義角色標籤)的背景下,它更經常被稱爲Agent。有一些開源工具(例如UIUC SRL parser)可以執行語義角色標註,至少對於英語而言,但它們通常在單獨的謂詞上工作,其中一個句子中可能有多個謂詞,所以必須找出哪個「subject」是「主」一個。

我不認爲後者的概念是明確定義的,事實上,就像在一個複雜的句子中,可能不清楚哪個主題是「主」主題。對某種特定類型的句子可能更有意義,但不一般。如果你描述了你正在使用的數據和/或給出了一些例子,我認爲這會有所幫助。

P.S.你可能會考慮問這個問題https://linguistics.stackexchange.com/