2014-03-02 68 views

回答

1

這很容易。使用pipelines.py中的dropitem刪除項目。您可以使用自定義命令對程序內部的參數進行編碼。

Here is example of custom code in scrapy

使用自定義命令(比如:scrapy crawl mycommand

可以運行-s JOBDIR=crawls/somespider-1

例子:

創建一個目錄commands,你必須scrapy.cfg文件 目錄中創建一個文件mycommand.py

from scrapy.command import ScrapyCommand 
from scrapy.cmdline import execute 



class Command(ScrapyCommand): 
    requires_project = True 

    def short_desc(self): 
     return "This is your custom command" 


    def run(self, args, opts): 
     args.append('scrapy') 
     args.append('crawl') 
     args.append('spider')##add what ever your syntax needs.In my case i want to get "scrapy crawl spider" in cmd 
     execute(args)#send a list as parameter with command as a single element of it 

現在轉到cmd行並鍵入scrapy mycommand。然後你的魔法準備:-)

+0

你能澄清更多 –

+0

我問這個'自定義命令我code' –

+0

內,我會給你一個樣品,然後 – Nabin