我正在練習建設web刮板。我現在正在開展的一項工作涉及到一個網站,爲該網站上的各個城市刮取鏈接,然後爲每個城市提供所有鏈接,並在所述鏈接中抓取所有鏈接。用Python和美麗的湯刮網
我用下面的代碼:
import requests
from bs4 import BeautifulSoup
main_url = "http://www.chapter-living.com/"
# Getting individual cities url
re = requests.get(main_url)
soup = BeautifulSoup(re.text, "html.parser")
city_tags = soup.find_all('a', class_="nav-title") # Bottom page not loaded dynamycally
cities_links = [main_url + tag["href"] for tag in city_tags.find_all("a")] # Links to cities
如果我打印出來city_tags
我得到我想要的HTML。但是,當我打印cities_links
時,我得到AttributeError: 'ResultSet' object has no attribute 'find_all'
。
我從其他q的收集在這裏,發生此錯誤,因爲city_tags
返回無,但如果它打印出所需的html不能這樣的情況?我已經注意到,說html是[] - 這是否有所作爲?