我一直在試圖讓一個簡單的蜘蛛與scrapy運行,但不斷收到錯誤:Scrapy找不到蜘蛛錯誤
Could not find spider for domain:stackexchange.com
scrapy-ctl.py crawl stackexchange.com
代碼
。蜘蛛是如下:
from scrapy.spider import BaseSpider
from __future__ import absolute_import
class StackExchangeSpider(BaseSpider):
domain_name = "stackexchange.com"
start_urls = [
"http://www.stackexchange.com/",
]
def parse(self, response):
filename = response.url.split("/")[-2]
open(filename, 'wb').write(response.body)
SPIDER = StackExchangeSpider()`
完全相同的問題幾個月前另一個人幾乎貼,但並沒有說他們是如何解決它,Scrapy spider is not working 我一直在關注turtorial正是在http://doc.scrapy.org/intro/tutorial.html,並不能找出它爲什麼不管用。
當我在Eclipse中運行這個代碼,我得到的錯誤
Traceback (most recent call last): File "D:\Python Documents\dmoz\stackexchange\stackexchange\spiders\stackexchange_spider.py", line 1, in <module> from scrapy.spider import BaseSpider ImportError: No module named scrapy.spider
我想不通爲什麼它沒有找到基地蜘蛛模塊。我的蜘蛛是否必須保存在腳本目錄中?
我的蜘蛛沒有任何規則聲明,所以我不認爲這適用。但我可能是錯的。 – Kristin 2010-05-22 01:04:25
使用本教程中定義的DmozSpider時,您會遇到同樣的錯誤嗎? – unutbu 2010-05-22 01:36:14
我還沒有嘗試與dmoz作爲域。我所做的只是改變它爬行的網站。 – Kristin 2010-05-22 01:46:28