-1
我可以採用URL,然後履帶遵循每個URL的起始網址的下一頁鏈接及其工作LinkExtractor - 與條件提取
rules = (Rule(LinkExtractor(allow=(), restrict_xpaths=('//a[@class="pagnNext"]',)), callback="parse_start_url", follow= True),)
但是你可以想像我開始在一些獲得驗證碼指向一些網址。我聽說可能有蜜罐對人類來說是不可見的,但是在設計的html代碼中,可以讓你點擊以識別你是一個bot。
我要讓提取提取鏈接有條件例如不提取,如果CSS樣式顯示點擊:不存在或類似的東西
是這是可行的
不確定你在問什麼 – Umair