1
解析XML塊考慮下面的XML:與LXML
<language>en-US</language>
<provider>VenturesLLC</provider>
<video>
<original_spoken_locale>en-US</original_spoken_locale>
<vendor_offer_code>TEST_VENDOR</vendor_offer_code>
<release_date>2011-01-15</release_date>
<title>Moving Forward</title>
<vendor_id>ASDF_ING_2012</vendor_id>
</video>
我期待檢索整個<video>
塊。然而,當我這樣做:
>>> f=open('metadata.xml')
>>> contents=f.read()
>>> node=etree.fromstring(contents)
>>> node.xpath("//*[local-name()='video']")[0].text
'\n
需要注意的是,如果我不喜歡的東西node.xpath("//*[local-name()='original_spoken_locale']")[0].text
我得到的'en-US'
正確的值。如何將我拉這個完整的文本,所以我可以得到:
text = """
<video>
<original_spoken_locale>en-US</original_spoken_locale>
<vendor_offer_code>TEST_VENDOR</vendor_offer_code>
<release_date>2011-01-15</release_date>
<title>Moving Forward</title>
<vendor_id>ASDF_ING_2012</vendor_id>
</video>"""
你可以用'node.text_content()'得到一個節點下的所有文本作爲單個字符串,或'node.itertext()的字符串'遍歷每個文本節點的內容分別。 – spiralx