我必須抓取一個網站,所以我用Scrapy來做,但我需要通過一個cookie繞過第一頁(這是一種登錄頁面,你選擇你的位置)Scrapy Cookie操作如何?
我聽說在網絡上,你需要使用基礎蜘蛛(而不是抓取蜘蛛)來做到這一點,但我需要使用抓取蜘蛛來抓取,所以我需要做什麼?
起初是基地蜘蛛?然後啓動我的抓取蜘蛛?但我不知道Cookie是否會在它們之間傳遞,或者我該如何做?如何從另一隻蜘蛛發射蜘蛛?
如何處理cookie?我試着用這個
def start_requests(self):
yield Request(url='http://www.auchandrive.fr/drive/St-Quentin-985/', cookies={'auchanCook': '"985|"'})
但不工作
我的答案應該是here,但那傢伙真的是迴避,我不知道該怎麼辦。
你可以看看我的答案在這裏:http://stackoverflow.com/a/ 22569515/2572383。它結合了登錄階段和CrawlSpider規則。 –
謝謝,你的邏輯就是我想做的,做第一個請求登錄然後啓動爬行,但是這裏http://www.auchandrive.fr/drive/prehome?utm_campaign=auchanfr_logo&utm_medium=Interne&utm_source=Sphere_Auchan 我需要去通過這cookie與我認爲.Btw我開始認爲cookie通過JS:/ – Akhu