好吧,我完全不知所措。我已經從依賴關係樹分析工具,它看起來像下面的一些輸出:如何解析依賴樹的輸出爲扁平結構
(S
(NP
(PRP It)
)
(VP
(VBD said)
(CLAUSE
(S
(NP
(DT the)
(NN figure)
)
(VP
(VBD was)
(VBN rounded)
)
)
)
)
(PUNC .)
)
這些解析輸出,保存爲純文本。據我所知,輸出基本上是一棵二叉樹。我想要的是有一個輸出文件,每個單詞放在一個新行中,每個單詞包含與該單詞相關的所有標籤。一個例子是:
It S NP PRP
said S VP
the S VP CLAUSE S NP DT
figure S VP CLAUSE S NP NN
was S VP CLAUSE S VP VBD
rounded S VP CLAUSE S VP VBN
. PUNC S
如何解析這個輸出到我要找的輸出中?我試圖使用pyparsing
庫,並且已經能夠將字符串解析爲列表的分層列表,但這不能滿足我的輸出需求。
我認爲遞歸可能是一個很好的候選工具,但我不確定如何將其應用於此問題。任何幫助,這將不勝感激 - 甚至僞代碼來實現的想法。