2011-10-27 54 views
0

我有一個網站解析,現在我想瀏覽通過標籤,或顯示圖形。 如何獲得圖表?或導航通過樹。顯示其他的第一步,等等。並瞭解樹是如何建成的。導航槽lxml類別

import urllib 
from lxml import etree 
import StringIO 
resultado=urllib.urlopen('trozo.html') 
html = resultado.read() 
parser= etree.HTMLParser() 
tree=etree.parse(StringIO.StringIO(html),parser) 

我只想檢查節點!圖表很酷,但我只想檢查它!

一種解決方案請.... :)

回答

0

你所取得的解析,你可以看到,如果你做到以下幾點:

>>> tree 
<lxml.etree._ElementTree object at 0x0148AF08> 

現在,你可以通過使用lxml._ElementTree功能此元素,這裏記載:http://lxml.de/tutorial.html

這裏有一些基本知識,用一個簡單的文件,我從我的本地網絡有:

>>> tree.getroot() 
<Element html at 147aae0> 
>>> tree.getroot().tag 
'html' 
>>> tree.getroot().text 
>>> for child in tree.getroot().getchildren(): 
    print child.tag, child.getchildren() 
head 
body 
>>> for child in tree.getroot().getchildren(): 
    print child.tag, [sub_child.tag for sub_child in child.getchildren()] 
head ['title'] 
body ['h1', 'p', 'hr', 'address']