0
我想抓取一個網站,但是當我運行這段代碼時,它只打印一半的數據(包括評論數據)。這裏是我的腳本:BeautifulSoup不抓取所有數據
from bs4 import BeautifulSoup
from urllib.request import urlopen
inputfile = "Chicago.csv"
f = open(inputfile, "w")
Headers = "Name, Link\n"
f.write(Headers)
url = "https://www.chicagoreader.com/chicago/best-of-chicago-2011-food-drink/BestOf?oid=4106228"
html = urlopen(url)
soup = BeautifulSoup(html, "html.parser")
page_details = soup.find("dl", {"class":"boccat"})
Readers = page_details.find_all("a")
for i in Readers:
poll = i.contents[0]
link = i['href']
print(poll)
print(link)
f.write("{}".format(poll) + ",https://www.chicagoreader.com{}".format(link)+ "\n")
f.close()
- 是我的腳本風格錯了嗎?
- 如何縮短代碼?
- 何時使用
find_all
和find
未獲取屬性錯誤。我閱讀文檔,但不明白。
嗨沙欣,可以請你提供find_all的和找到一個簡短的例子..? –
@ Mr.Bones,我已經給出了一個find和find_all的例子。看上面。 – SIM