1
所以我寫了一個蜘蛛,它從網頁中提取某些期望的鏈接,並將網址,鏈接文本和其他不一定包含在<a>
標籤中的信息放入每個鏈接的項目中。有一個蜘蛛使用從另一個蜘蛛返回的物品?
我應該如何將這個項目傳遞給另一個蜘蛛,該蜘蛛會抓取該項目中提供的URL?
所以我寫了一個蜘蛛,它從網頁中提取某些期望的鏈接,並將網址,鏈接文本和其他不一定包含在<a>
標籤中的信息放入每個鏈接的項目中。有一個蜘蛛使用從另一個蜘蛛返回的物品?
我應該如何將這個項目傳遞給另一個蜘蛛,該蜘蛛會抓取該項目中提供的URL?
此問題已被詢問了很多次。 下面是本網站上的一些鏈接,可以回答你的問題。 有些人直接回答它,即將項目傳遞給另一個函數,但您可能會意識到,您不需要這樣做,所以其他方法鏈接以顯示可能性。
Using multiple spiders at in the project in Scrapy
Scrapy - parse a page to extract items - then follow and store item url contents
這些都不實際使用2種蜘蛛。如果第一個人找到csvs的鏈接,第二個人應該解析它們,我想用CSVSpider呢? – Suor