我是Scrapy的新手,我無法在任何地方找到我需要做的事情。Scrapy:遵循特定規則的網址
我需要刮一組非常相似的網址,但我無法從一個到另一個。例如,我需要抓取以下網址:
www.example.com/1.html
www.example.com/2.html
(...)
www.example.com/1000.html
但是在第一頁上沒有鏈接到其他頁面,即獨立。
我該怎麼做? (對不起,我的英語)
事情是這樣的:
class MySpider(BaseSpider):
name = 'example.com'
allowed_domains = ['example.com']
Start_urls = [
'http://www.example.com/1.html',
'http://www.example.com/2.html',
'http://www.example.com/3.html',
]
但
感謝超過3個不同的網頁
!
這正是我所需要的。謝謝 –