Python新手,有人可以解釋findAll("a")
在以下代碼中的含義嗎?我可以放置其他任何信件嗎?像g,h,m? 'a'是否意味着在文章中找到「a」?在beautifulsoup python中查找所有(「a」)
和href=re.compile("^(/wiki/)((?!:).)*$"))
是否意味着找到那些具有wiki名稱的鏈接?
from urllib.request import urlopen
from bs4 import BeautifulSoup
import re
html = urlopen("http://en.wikipedia.org/wiki/Kevin_Bacon")
bsObj = BeautifulSoup(html)
for link in bsObj.find("div", {"id":"bodyContent"}).findAll("a",
href=re.compile("^(/wiki/)((?!:).)*$")):
if 'href' in link.attrs:
print(link.attrs['href'])
有人可以請建議一些很好的書籍來學習網頁抓取在python 3.6,初學者可以輕鬆學習?
[查看文檔]開始時,所有鏈接(https://www.crummy.com/software/BeautifulSoup/bs3/documentation.html) – Mangohero1