0
我試圖讓節點下的文本和id,見例如文件位置:example.xmlLXML Python中,閱讀文本和樹XML文件中的給定結構
但是,它不具有結構爲常規的XML文件。該結構如下:
<TextWithNodes><Node id="0"/>
<Node id="1"/>
<Node id="2"/>9407011<Node id="9"/>
<Node id="10"/>ACL<Node id="13"/> <Node id="14"/>1994<Node id="18"/>
<Node id="19"/> Lg.Pr.Dc <Node id="29"/>
我想輸出是start_node
,end_node
和text_between_node
列表。我不確定我是否可以使用lxml
庫來做到這一點。
目前,我用
from lxml import etree
tree = etree.parse('9407011.az-scixml.xml')
nodes = tree.xpath('//TextWithNodes')[0].getchildren()
node = nodes[0] # example one node
print(node.text) # this give empty string because you don't have closing same id
請出示您嘗試使用發佈樣品或鏈接你期望的結果。 – Parfait