0
我想使用python中的scrapy從鏈接「http://www.shopclues.com/diwali-mega-mall/hot-electronics-sale-fs/audio-systems-fs.html」中提取所有產品網址。下面是我使用完成該轉換的功能:無法在python中使用scrapy刮掉產品網址
def parse(self, response):
print("hello");
hxs = HtmlXPathSelector(response)
sites = hxs.select('//div[@id="pagination_contents"]')
items = []
i=3
for site in sites:
item = DmozItem()
item['link'] = site.select('div[2]/div['+str(i)+']/a/@href').extract()
i=int(i)+1;
print i
items.append(item)
return items
每個產品div的x路是:// DIV [@ ID = 「pagination_contents」]/DIV [2] /格['+ str(i)+']/a/@ href
但是我只收到一個鏈接,而不是所有產品的網址。