2017-06-06 87 views
1

一個特殊的SRC爲了得到一個網站的所有圖像得到的href我寫這篇文章的代碼:如何與孩子格在Python Scrapy

content = Selector(text = html) 
all_images= content.css('img') 
i = 0 

for image in all_images: 
    src = image.css("::attr('src')").extract_first() 

獲取圖像的src後,現在我想有HREF每個圖像的

<a href="/rayons/images" onclick="ga('send', 'event', 'computer HP', 'htwe', 'ope_xxl_s22Englos');"> 
    <img src="/mySrc/" alt="something" class="ze-content"> 
</a> 

我怎樣才能得到HREF當我知道Src的

回答

3

AFAIK,你不能使用CSS做父母搜索。在這種情況下,XPath更合適。你可以這樣做:

for image in all_images: 
    src = image.css("::attr('src')").extract_first() 
    href = image.xpath('parent::a/@href').extract_first() 

或者,使用XPath的abbreviated syntax

href = image.xpath('../@href').extract_first()