使用python從網頁中提取部分

我想使用python和lxml從以下網站中提取部分症狀的測試部分。任何人都可以請幫忙。使用python從網頁中提取部分

http://www.ncbi.nlm.nih.gov/pubmedhealth/PMH0001851/

謝謝

2012-02-27 Deepak Nath

是否需要使用lxml？ – 2012-02-27 18:49:28

你想用刮lxml的網頁？試試這個：

from lxml.html import parse 
doc = parse("http://www.ncbi.nlm.nih.gov/pubmedhealth/PMH0001851/").getroot() 
for h2 in doc.cssselect('h2'): 
    print h2.text_content()

這將打開從您的頁面搶h2s。

來源

2012-02-27 19:47:58 JKirchartz

使用python從網頁中提取部分

回答

相關問題