2015-12-04 40 views
1

從給定的URL我做閱讀內容如下:是否有可能使用Python請求庫來閱讀Wikipedia?

import requests 
proxies = {'http':'http://user:[email protected]:7777'} 
url = 'http://example.com/foo/bar' 
r = requests.get(url, proxies = proxies) 
print r.text.encode('utf-8') 

,它工作正常!我收到內容。

但是,如果我用另一個網址:

url = 'https://en.wikipedia.org/wiki/Mestisko' 

它不工作。我收到一條以下列錯誤消息:

requests.exceptions.ConnectionError: ('Connection aborted.', error(10060 

Wikipedia阻止自動請求?

ADDED

我試圖設置一個用戶代理通過以下方式:

headers = {'User-Agent':'Mozilla/5.0'} 
r = requests.get(url, proxies = proxies, headers = headers) 

遺憾的是它並不能幫助。我仍然得到同樣的錯誤。

加入2-

現在我很困惑。如果我嘗試使用設置代理從http://example.com/foo/bar獲取內容,我可以得到它。如果我沒有設置代理服務器,我會得到由代理生成的內容。這種行爲我可以理解。現在,如果我嘗試從維基百科獲取內容,則無論是設置還是未設置代理,我都會得到相同的錯誤消息。所以,我不明白這個錯誤信息來自維基百科或代理(這兩個選項都不是真的)。

proxies = {'http':'http://user:[email protected]:7777'} 

與以下行:

+0

@CharlesP,我需要什麼別的傳遞? – Roman

+0

適合我使用urllib2 – felipsmartins

+0

羅馬 - 當我離開這次會議時,讓我在ipython中玩耍。我記不起來了。 –

回答

相關問題