0
我想使用python中的scrapy從鏈接「http://presskr.com/category/Mobiles--Tablets/35」中提取整個產品網址。下面是我使用完成該轉換的功能:如何在Python中使用Scrapy刮取網址
def parse(self, response):
print("hello");
hxs = HtmlXPathSelector(response)
sites = hxs.select('//div[@id="pagination_contents"]')
items = []
i=3
for site in sites:
item = DmozItem()
item['link'] = site.select('div[2]/div['+str(i)+']/a/@href').extract()
i=int(i)+1;
print i
items.append(item)
return items
每個產品div的x路是:// DIV [@ ID = 「pagination_contents」]/DIV [2] /格['+ str(i)+']/a/@ href
但是我只收到一個鏈接,而不是所有產品的網址。
非常感謝你** Turo **我懂了 –