0
我正在尋找一個鏈接http://gaana.com/。我想得到編輯器選擇相冊的列表,但我無法刮取此鏈接,不知道我的代碼中有什麼錯誤。 我的蜘蛛代碼:如何刮scrapy使用scrapy
import scrapy
from tutorial.items import GannaItem
class GannaSpider(scrapy.Spider):
name = 'gannaspider'
start_urls = ["http://www.songspk.link/"]
def parse(self, response):
for sel in response.xpath('/html/body'):
item = GannaItem()
item['Albumname'] = sel.xpath('div[4]/div[4]/div[2]/div[1]/div[5]/div/ul/li[1]/div/div[2]/a[1]/span/text()').extract()
item['link'] = sel.xpath('div[4]/div[4]/div[2]/div[1]/div[3]/div/div[2]/div/ul/li[1]/div/div[2]/a/@href').extract()
yield item
而且我得到的輸出
{'Albumname': [], 'link': []}