0
我發現了一些我想要提取的數據(http://www.education.gov.uk/edubase/public/quickSearchResult.xhtml?page=1),但是我需要掃描1080頁,有沒有人知道爲他們的<table>
元素刮取多頁的方法?從多個頁面中提取數據
我發現了一些我想要提取的數據(http://www.education.gov.uk/edubase/public/quickSearchResult.xhtml?page=1),但是我需要掃描1080頁,有沒有人知道爲他們的<table>
元素刮取多頁的方法?從多個頁面中提取數據
我想你想嘗試IRobotSoft網頁抓取。它是免費的並提供可視化界面。先看看http://www.irobotsoft.com/help/的演示。他們的論壇也非常有幫助。
對語言的任何偏好? Scrapy在Python中是一個很好的框架,用於這種類型的抓取(http://doc.scrapy.org/en/latest/index.html) –
最好是PHP,但只要能夠獲取數據,它並不重要 –