我可以湊這個網站的第一頁:(Python 3中,BeautifulSoup 4) - 在股利
http://ratings.food.gov.uk/enhanced-search/en-GB/%5E/London/Relevance/0/%5E/%5E/0/1/10
但我嘗試使用刮網站上的所有其它頁面網站分頁中的「下一步」按鈕。
我已經點擊了下一步按鈕,我可以看到參數的變化是從0/1/10到0/2/10頁2等等。
我已經看過了分頁代碼,我可以看到,分頁是一個DIV
<div id="pagingNext" class="link-wrapper">
的問題是我用下面的代碼只有順利地刮取分頁從其他網站:
button_next = soup.find("a", {"class": "btn paging-next"}, href=True)
while button_next:
time.sleep(2)#delay time requests are sent so we don't get kicked by server
soup=makesoup(url = "https://www.propertypal.com{0}".format(button_next["href"]))
這個工作,但這個網站我目前刮似乎並沒有提供AA HREF爲下一步按鈕URL,我失去了對如何嘗試和刮它
我試過了:
button_next = soup.find("div", {"class": "paging-Next"})
while button_next:
time.sleep(2)#delay time requests are sent so we don't get kicked by server
soup=makesoup(url = "https://www.propertypal.com{0}".format(button_next))
但它似乎並沒有刮掉其他頁面,只是第一頁還在。
如果任何人都可以提供幫助,我會非常感激。
感謝
我認爲你需要'Selenium'這個 –