我完全難住爲什麼lxml .text
會給我一個兒童標籤的文本,但爲根標籤。如何使用lxml獲取根元素的文本?
some_tag = etree.fromstring('<some_tag class="abc"><strong>Hello</strong> World</some_tag>')
some_tag.find("strong")
Out[195]: <Element strong at 0x7427d00>
some_tag.find("strong").text
Out[196]: 'Hello'
some_tag
Out[197]: <Element some_tag at 0x7bee508>
some_tag.text
some_tag.find("strong").text
返回<strong>
標籤之間的文本。
我希望some_tag.text
返回<some_tag> ... </some_tag>
:
<strong>Hello</strong> World
相反,它沒有返回。
我試過了minidom,但似乎也沒有工作。 'some_tag_md = minidom。parseString( '你好世界 ')' 'some_tag_md.nodeValue' :/ –
2012-04-21 12:43:02