2013-04-24 147 views
2

我有這段代碼從網頁讀取鏈接(URL)並將它們打印在屏幕上。從dom.xpath獲取img src

connection = urllib.urlopen("http://www.google.com") 
dom = lxml.html.fromstring(connection.read()) 
for link in dom.xpath('//a/@href'): 
    print link 

它工作正常。
現在我想要做的完全一樣的東西,但代替URL的錨定標記a我想要得到的圖像在 src下的HTML標記的網址。我無法理解dom.xpath('//a/@href')是如何工作的。如果有人能夠解釋它或只是引導我參加一個教程,那就太好了。
乾杯

回答

3

有關xpath的開頭,請查看http:wiki/XPath或瞭解有關USING XPATHS的更多信息。 (<a>標籤)。

對於所有圖像src屬性,這將是//img/@src

+0

非常感謝你 – Leonidus 2013-04-25 04:31:24