是否有可能抽取數據的形式存在維基百科文章內的子鏈接如何從維基百科文章中的子鏈接刮取數據?
import bs4 as bs
import urllib.request
import re
sauce = urllib.request.urlopen('https://en.wikipedia.org/wiki/Greenhouse_gas').read()
soup=bs.BeautifulSoup(sauce,'lxml')
links = soup.find("div",{"id" : "bodyContent"}).findAll("a" , href=re.compile("(/wiki/)+([A-Za-z0-9_:()])+"))
for link in links:
print(link['href'])
webpage=urllib.request.urlopen(link['href'])
soup=bs.BeautifulSoup(webpage,'lxml')
問題是什麼,在這裏?是的,它「可以從維基百科文章中提取數據形式的子鏈接」;什麼是錯誤的/運行上面的代碼時會得到什麼回溯? – blacksite