0
我正在嘗試創建一個通用蜘蛛,它負責處理最常見的任務和特定的蜘蛛,它們繼承通用的蜘蛛並聲明網站特定的變量。創建一個通用scrapy蜘蛛和多個特定的
還有就是genericspider.py
:
# -*- coding: utf-8 -*-
import scrapy
from scrapy.spiders import Spider, CrawlSpider
class GenericProductSpider(scrapy.Spider):
def __init__(self, start_urls=[], finditemprop='', keywords='', **kwargs):
CrawlSpider.__init__(self, **kwargs)
print ("\n\n Init Generic \n")
然後我得在同一目錄中通用的一個specificspider.py
。
# -*- coding: utf-8 -*-
import scrapy
from scrapy.spiders import Spider, CrawlSpider
from .genericfabric import GenericFabricsSpider
class SpecificSpider(GenericProductSpider):
def __init__(self, **kwargs):
print ("\n init specific \n")
name = "specific1"
start_urls = ['http://www.specificdomian.com',]
super(SpecificSpider, self).__init__(name, start_urls, **kwargs)
我似乎有理解如何正確調用超類的初始值設定項的問題。我得到各種錯誤消息,但通用蜘蛛的方法從未被執行過。
查找cookiecutter python模塊查找cookiecutter scrapy模板.... y – scriptso
@scriptso看起來很有趣。據我瞭解,這將是一種模板,我可以拋出我的變量,併爲我創建蜘蛛?如果我需要更新代碼,我需要在我假設的所有蜘蛛中更新它。 – Chris