0
我有以下規則Scrapy是跳過我的拒絕規則
Rule(SgmlLinkExtractor(allow=r'.*?', deny=r'/preferences')),
Rule(SgmlLinkExtractor(allow=r'.*?', deny=r'/auth')),follow=True),
但我看到在日誌下面。我也嘗試過,沒有允許=,它仍然是一樣的。我是否需要忽略來自中間件的這些URL?
014-01-08 21:31:07 + 0100 [mybot] DEBUG:爬(200)http://mydomain.com/preferences/language?continue_to=xxxxx>(引薦:http://mydomain.com/categories/something-something-something)