-3
如何檢查超鏈接是圖片鏈接還是網頁鏈接。如何檢查(https://)是否爲圖片或網頁鏈接
image_list = []
url = 'http://www.image.jpg/'
if any(x in '.jpg .gif .png .jpeg' for x in url):
image_list.append(url)
else:
r = requests.get(url)
soup = BeautifulSoup(r.content, "html5lib")
for link in soup.find_all('img'):
src = link.get('src')
if src.startswith("https"):
image_list.append(src)
上面找出的超級鏈接作品的代碼包含的圖像格式,但是每當我使用的鏈接不包含名爲「.jpg等...」它仍然附加的鏈接image_list,並跳過其他聲明。
有沒有可能的方法,你可以弄清楚'any(x in'...'for x in url)'是否在做你期望的?這可能有助於縮小問題範圍。 – aug