2012-02-27 69 views

回答

1

你想用刮lxml的網頁?試試這個:

from lxml.html import parse 
doc = parse("http://www.ncbi.nlm.nih.gov/pubmedhealth/PMH0001851/").getroot() 
for h2 in doc.cssselect('h2'): 
    print h2.text_content() 

這將打開從您的頁面搶h2s。