2015-04-22 25 views
2

我有一個抓取程序,在收集我感興趣的網址時工作得很好。但是,在檢索這些網址的內容之前(即滿足規則3 ),我想更新它們,即在右側添加一個後綴 - 比如'/ fullspecs'。這意味着,事實上,我想檢索並進一步處理 - 通過回調函數 - 只更新的。我怎樣才能做到這一點?如何在scrapy中執行回調之前添加網址後綴

rules = (
     Rule(LinkExtractor(allow=('something1'))), 
     Rule(LinkExtractor(allow=('something2'))), 
     Rule(LinkExtractor(allow=('something3'), deny=('something4', 'something5')), callback='parse_archive'), 
) 

回答