這是我第一次嘗試創建一隻蜘蛛,如果我沒有正確完成,請不要吝惜我。 這裏是我試圖從中提取數據的網站的鏈接。 http://www.4icu.org/in/。我想要顯示在頁面上的大學的整個列表。但是當我運行下面的蜘蛛時,我返回一個空的json文件。 我items.pyscrapy蜘蛛沒有返回任何結果
import scrapy
class CollegesItem(scrapy.Item):
# define the fields for your item here like:
link = scrapy.Field()
這是蜘蛛 colleges.py
import scrapy
from scrapy.spider import Spider
from scrapy.http import Request
class CollegesItem(scrapy.Item):
# define the fields for your item here like:
link = scrapy.Field()
class CollegesSpider(Spider):
name = 'colleges'
allowed_domains = ["4icu.org"]
start_urls = ('http://www.4icu.org/in/',)
def parse(self, response):
return Request(
url = "http://www.4icu.org/in/",
callback = self.parse_fixtures
)
def parse_fixtures(self,response):
sel = response.selector
for div in sel.css("col span_2_of_2>div>tbody>tr"):
item = Fixture()
item['university.name'] = tr.xpath('td[@class="i"]/span /a/text()').extract()
yield item
哇,你必須先看看您的代碼中存在一些問題。而且因爲在運行蜘蛛時你沒有得到任何異常,所以你可以放心,你永遠不會到達'parse_fixtures'方法或至少'for'循環。 – GHajba