2012-11-21 156 views
1

我使用python打開與下面的代碼的URL,有時我得到這個錯誤:的urlopen(URL)403 Forbidden錯誤

從urllib的進口的urlopen URL =「HTTP://www.gutenberg。組織/文件/ 2554/2554.txt」 原料=的urlopen(URL).read()

錯誤: '\ n \ N403紫禁城\ n \ n

故宮

\ n

你不\' 噸有權限訪問/files/2554/2554.txt\non此服務器。

\ n
\ nApache服務器在www.gutenberg.org端口80 \ n \ n」

這是什麼?

謝謝

回答

2

這是網頁封鎖Python的訪問,因爲它正在與標題「的User-Agent的要求。

要解決這個問題,請下載「的urllib2」模塊,並使用此代碼:

req = urllib2.Request(url, headers ={'User-Agent':'Chrome'}) 
raw = urllib2.urlopen(req).read() 

你是知道與頭「Chrome」和訪問該網站不再被禁止(我嘗試過自己和它的工作)。

希望這會有所幫助。