我對Python有點新,對Scrapy也很新。通過Scrapy Spider要通過.txt文件抓取的URL列表
我設置了一個蜘蛛抓取並提取所有我需要的信息。但是,我需要將URL的.txt文件傳遞給start_urls變量。
對於〔實施例:
class LinkChecker(BaseSpider):
name = 'linkchecker'
start_urls = [] #Here I want the list to start crawling a list of urls from a text file a pass via the command line.
我已經做了一點點研究,並保持未來空手而歸。我見過這種類型的例子(How to pass a user defined argument in scrapy spider),但我認爲這不適用於傳遞文本文件。