2015-06-09 67 views
0

這個問題擴展到Identifying preposition or conjunction最好的辦法弄清楚模式樹狀結構

看看這棵樹:

Simple tree

我已經想通了,如果IN的母公司是SBAR那麼它就是連接,如果它是PP,那麼它就是介詞(我假設IN始終來自SBAR或PP的)。

但是,我無法以這種方式迭代遍歷樹。

我不確定這些事情: 1.我是否正確地區分連詞和介詞? 2.乍一看我還以爲這個邏輯就要正確

如SBAR> IN>因爲===結合 PP> IN>與===介詞

但是, 看一看這句話

我想我永遠不會是相同的,因爲我們都爲你傾倒

enter image description here

所以,現在我認爲這個邏輯將是正確的

如果SBAR>迭代...左邊的孩子找到IN然後標記爲連接。

enter image description here

請指導我如何去做。 我對Tregex,Semregex或Tsurgeon沒有太多的知識。在這種情況下它會有幫助嗎? 請給出一些如何正確迭代樹的例子。

回答

1

最簡單的解決方案可能是查看依賴關係解析。

實際介詞將附在他們的頭上,與case關係相關,而從屬連詞將以mark關係附加到他們的頭上。

+0

傷心部位在也被標記爲標記,它是介詞[mark(fighting-4,in-3) advcl(engaged-2,fighting-4) mark(attacked-7,after-5)] ...之後是正確的從屬連詞... – swapyonubuntu

+0

是的,這個解決方案在所有情況下都不是正確的,因爲它依賴於正確的分析樹和正確的詞性標記(在你的例子中,「格鬥」可以說是無可爭議的錯誤地標記爲動詞),但對於所有統計自然語言處理工具來說都是如此。 –