我已經成功地使用了urllib2,但是對於這個網站,我突然測試了它並沒有工作。我在論壇上看過,並嘗試了一些修復程序,它似乎並沒有工作。下面是一個解決方案的例子,但不適合我。有人可以幫助我連接到它。HTTP錯誤403:禁止的urlib2 Python 2.7
,讓錯誤的代碼:
from bs4 import BeautifulSoup
import urllib2
proxy_support = urllib2.ProxyHandler({"http":"http://username:[email protected]:port"})
hdr = {'Accept': 'text/html,application/xhtml+xml,*/*'}
url = 'http://www.carnextdoor.com.au/'
opener = urllib2.build_opener(proxy_support)
urllib2.install_opener(opener)
req=urllib2.Request(url,headers=hdr)
#Here I get the error with and without using the header or going html = urllib2.urlopen(url).read()
html = urllib2.urlopen(req).read()
soup=BeautifulSoup(html,"html5lib")
print soup
您有可能在網站上被阻止 – YOU
? – FancyDolphin
根據回答,這是網站 – YOU