我有一些非常簡單的python代碼,它試圖獲取網頁的HTML。當在已知的可用url上使用urllib.request.urlopen()時發生HTTPError
import urllib
url = 'https://www.____.com' # A URL that works in my browser
u = urllib.request.urlopen(url)
然後我用u
找到網頁上的鏈接和下載文件。
我一直在使用此代碼幾天沒有問題,但現在我收到一個HTTPError 503: Service Temporarily Unavailable
當我嘗試打開該URL。我對這類東西並不十分了解,但我認爲該網站發現一個機器人不斷嘗試訪問並以某種方式阻止了它。
我該如何解決這個問題?是否有更友好的網頁檢索方式?