2013-04-18 38 views
1

我的蜘蛛目前正在從網站上抓取一個xml。這樣做是成功的,因爲我可以看到通過數據庫管道存儲的項目。Scrapy指出沒有頁面/項目已被抓取?

但是,當我查看日誌(設置爲log.INFO)時,它表示沒有任何內容被抓取?

2013-04-12 11:58:00-0400 [traffics] INFO: Spider opened 
2013-04-12 11:58:00-0400 [traffics] INFO: Crawled 0 pages (at 0 pages/min), scraped 0 items (at 0 items/min) 
2013-04-12 11:58:03-0400 [traffics] INFO: Closing spider (finished) 
2013-04-12 11:58:03-0400 [traffics] INFO: Dumping Scrapy stats: 
    {'downloader/request_bytes': 273, 
    'downloader/request_count': 1, 
    'downloader/request_method_count/GET': 1, 
    'downloader/response_bytes': 28883, 
    'downloader/response_count': 1, 
    'downloader/response_status_count/200': 1, 
    'finish_reason': 'finished', 
    'finish_time': datetime.datetime(2013, 4, 12, 15, 58, 3, 469842), 
    'log_count/DEBUG': 7, 
    'log_count/INFO': 4, 
    'response_received_count': 1, 
    'scheduler/dequeued': 1, 
    'scheduler/dequeued/memory': 1, 
    'scheduler/enqueued': 1, 
    'scheduler/enqueued/memory': 1, 
    'start_time': datetime.datetime(2013, 4, 12, 15, 58, 0, 907300)} 
2013-04-12 11:58:03-0400 [traffics] INFO: Spider closed (finished) 

爲什麼說它肯定會抓取(然後將它們保存到數據庫)的0個項目和0個頁面?

+0

你在哪裏「看到通過數據庫管道存儲的項目」? –

+0

@stevenalmeroth對不起,我的意思是用'sqlite3'命令查看數據庫。數據肯定存儲。 – Bak

+0

這聽起來像數據可能被緩存,嘗試從sqlite中清除數據。管道默認情況下不運行而不刮取物品。 –

回答

1

數據庫管道中的process_item方法是否在存儲後返回項目?

+0

是的,我返回數據庫管道中的項目。 – Bak