我剛剛安裝了scrapy,並遵循其工作原理簡單的dmoz tutorial。我只是查找了python的基本文件處理,並試圖讓抓取工具從文件中讀取URL的列表,但出現了一些錯誤。這可能是錯誤的,但我給了它一個鏡頭。請有人向我展示一個閱讀URL列表到scrapy的例子嗎?提前致謝。Scrapy從文件中讀取網址列表以進行刮取?
from scrapy.spider import BaseSpider
class DmozSpider(BaseSpider):
name = "dmoz"
allowed_domains = ["dmoz.org"]
f = open("urls.txt")
start_urls = f
def parse(self, response):
filename = response.url.split("/")[-2]
open(filename, 'wb').write(response.body)
'readlines方法()'保持在每一行的末尾的換行符。我已經提交了一個編輯文件,用於剝離換行符並關閉文件。 –