我正在製作python鏈接驗證程序,以便我可以取消給定網址中的所有鏈接並驗證它們。python鏈接驗證程序
我試圖在for循環中使用re模塊,事實證明這是無效的語法。
但我真的不能想出其他方式,可以拉出所有的鏈接,並檢查其中每一個..所以我需要幫助它。
下面的代碼:
import requests, bs4,webbrowser, re
from selenium import webdriver
url = str(input())
res = requests.get(url)
try:
res.raise_for_status()
except Exception as err:
print('There was a probelm with the first url: %s' % (err))
soup = bs4.BeautifulSoup(res.text, "html.parser")
linkElems = soup.select('a')
hrefRegex = re.compile(r'^"http(s)?://.*?"')
mo = hrefRegex.search(linkElems)
for i in range (len(linkElems[i])
mo = hrefRegex.search(linkElems[i])
res = requests.get(mo.group())
if res.status_code != requests.codes.ok:
print('%s is broken link. Response: 404 "Not Found"' % (mo.group()))
它說「莫」部分有無效的語法,所以我甚至不能測試它... :(
,並驗證手段確保該鏈路中斷,這意味着它們是有效的網址,這樣我們就不會從他們那裏404「未找到」消息
你是什麼意思與驗證?你會得到什麼錯誤信息? – linusg
@linusg我沒有收到錯誤消息,因爲在循環中放置'mo'是無效的語法。並驗證手段,以確保鏈接不被破壞,這意味着他們是有效的網址,以便我們不會從他們收到404「未找到」消息。 –