1
我正在使用美麗的湯4來解析正文文本中包含的鏈接的新聞站點。我能夠找到包含鏈接的所有段落,但每個鏈接都返回paragraph.get('href')
返回類型none
。我正在使用Python 3.5.1。任何幫助真的很感激。如何使用美麗的湯在指定的類中查找鏈接
from bs4 import BeautifulSoup
import urllib.request
import re
soup = BeautifulSoup("http://www.cnn.com/2016/11/18/opinions/how-do-you-deal-with-donald-trump-dantonio/index.html", "html.parser")
for paragraph in soup.find_all("div", class_="zn-body__paragraph"):
print(paragraph.get('href'))