我想從網站抓取數據;但是我不斷收到HTTP:錯誤405:不允許。我究竟做錯了什麼?嘗試使用Python抓取數據時發生Http錯誤405
(我已經看過的文件,並試圖自己的代碼,只有我的網址到位的例子年代,我仍然有同樣的錯誤。)
下面的代碼:
import requests, urllib
from urllib.request import Request, urlopen
list_url= ["http://www.glassdoor.com/Reviews/WhiteWave-Reviews-E9768.htm"]
for url in list_url:
req = urllib.request.Request(url, headers={'User-Agent': 'Mozilla/5.0'})
response=urllib.request.urlopen(req).read()
如果我跳過用戶代理術語,則會收到HTTP錯誤403:禁止。
在過去,我已經使用以下順利地刮取數據(從其他網站):
for url in list_url:
raw_html = urllib.request.urlopen(url).read()
soup=None
soup = BeautifulSoup(raw_html,"lxml")
理想情況下,我想保持一個類似的結構,即,通過獲取URL的內容到BeautifulSoup。 謝謝!