我需要遍歷美麗的湯元素並得到屬性值: 對於一個XML文檔:如何遍歷美麗的湯元素獲得屬性值
<?xml version="1.0" encoding="UTF-8"?>
<Document>
<Page x1="71" y1="120" x2="527" y2="765" type="page" chunkCount="25"
pageNumber="1" wordCount="172">
<Chunk x1="206" y1="120" x2="388" y2="144" type="unclassified">
<Word x1="206" y1="120" x2="214" y2="144" font="Times-Roman" style="font-size:22pt">K</Word>
<Word x1="226" y1="120" x2="234" y2="144" font="Times-Roman" style="font-size:22pt">O</Word>
</Chunk>
</Page>
</Document>
我想獲得的X1值「單詞」元素(206,226)。 幫助很多appriciated!
編輯: 我曾嘗試:
for i in soup.page.chunk:
i.word['x1']
返回一個錯誤:
File "C:\Python26\lib\site-packages\BeautifulSoup.py", line 473, in __getattr__
raise AttributeError, "'%s' object has no attribute '%s'" % (self.__class__.__name__, attr)
AttributeError: 'NavigableString' object has no attribute 'word'
同時:
soup.page.chunk.word['x1']
工作正常...和:
for i in soup.page.chunk:
i.findNext(text=True)
獲取文本形式的元素。
編輯的問題與我的失敗 – root