我在Mac OS X 10.6.8上運行Python 2.7.3中的以下代碼。在python中迭代xml元素時缺少一些文本
import StringIO
from lxml import etree
f = open('./foo', 'r')
doc = ""
while 1:
line = f.readline()
doc += line
if line == "":
break
tree = etree.parse(StringIO.StringIO(doc), etree.HTMLParser())
r = tree.xpath('//foo')
for i in r:
for j in i.iter():
print j.tag, j.text
而且文件foo包含
<foo> AAA <bar> BBB </bar> XXX </foo>
輸出是
foo AAA
bar BBB
爲什麼我沒有得到文本XXX
?我如何訪問它?
感謝
謝謝!這是一個我不知道的有趣的怪癖。 – APE