,因爲我們看到:scrapy如何抓取更多網址?
def parse(self, response):
hxs = HtmlXPathSelector(response)
sites = hxs.select('//ul/li')
items = []
for site in sites:
item = Website()
item['name'] = site.select('a/text()').extract()
item['url'] = site.select('//a[contains(@href, "http")]/@href').extract()
item['description'] = site.select('text()').extract()
items.append(item)
return items
scrapy只是得到一個頁面響應,並找到在頁面響應的URL。我認爲這只是一個表面爬行!
但我想要更多的定義深度的網址。
我能做些什麼來實現它?
謝謝!