2013-06-19 52 views
1

所以基本上這個想法是使用python登錄到一個網站,並複製一個html頁面的內容,只有在您登錄後才能查看。(根據https)如何使用python訪問https安全的網頁

有關如何實現此目的的任何建議? 請求? http.client.HTTPSConnection?

我現在有

h1 = http.client.HTTPSConnection(URL) #question: what exactly should this url page be? 
            https://accounts.google.com/ServiceLoginhl=en&continue=https://www.google.ca/ 
            or https://google.ca 
userAndPass = b64encode(b"usrname:pwd").decode("ascii") 
headers = { 'Authorization' : 'Basic %s' % userAndPass } 
#then connect 
h1.request('GET', '$THEPAGETHATIWANTTOACCESS', headers=headers) 

非常感謝!

+0

我已經使用[機械化](http://wwwsearch.sourceforge.net/mechanize/)請求(HTTP更好的成敗://文檔。 python-requests.org/en/latest/)比httplib。 – jedwards

回答

2

可以使用requests

r = requests.get('https://api.github.com/user', auth=('user', 'pass')) 
>>> r.status_code 
200 
>>> r.headers['content-type'] 
'application/json; charset=utf8' 
>>> r.encoding 
'utf-8' 
>>> r.text 
u'{"type":"User"...' 
>>> r.json() 
{u'private_gists': 419, u'total_private_repos': 77, ...} 
相關問題