如何向SgmlLinkExtractor添加網址?也就是說,我如何添加一個任意的URL來運行回調?Scrapy SgmlLinkExtractor添加任意網址
爲了詳細描述,使用dirbot作爲一個例子:https://github.com/scrapy/dirbot/blob/master/dirbot/spiders/googledir.py
parse_category只訪問相匹配的SgmlLinkExtractor SgmlLinkExtractor(一切允許='directory.google.com/[AZ] [A-ZA-Z_ /] + $')