2013-08-17 49 views

回答

1

我已經使用了簡單Requests和更復雜的httplib2。兩者都100%適合這項任務。

+0

如果網站使用JavaScript,你也可以添加[selenium](http://selenium-python.readthedocs.org/en/latest/)或[python-spidermonkey](https://github.com/davisp/python -spidermonkey)來增強您現有的代碼庫。 –

1

由於您從未向我們提供過有關您的問題的詳細信息,因此我們無法爲您提供詳細的說明。 然而,最有可能你想使用的urllib2獲取一個HTML頁面:

import urllib2 
response = urllib2.urlopen('http://python.org/') 
html = response.read() 

然後,您應該分析的形式,找出你需要與他們的名字發送的所有數據字段,然後創建自己的POST或GET請求,具體取決於表單類型。

要發送POST請求:

import urllib 
import urllib2 

url = 'http://www.someserver.com/cgi-bin/register.cgi' 
values = {'name' : 'Michael Foord', 
     'location' : 'Northampton', 
     'language' : 'Python' } 

data = urllib.urlencode(values) 
req = urllib2.Request(url, data) 
response = urllib2.urlopen(req) 
the_page = response.read() 

要發送GET請求:

import urllib2 
import urllib 
data = {} 
data['name'] = 'Somebody Here' 
data['location'] = 'Northampton' 
data['language'] = 'Python' 
url_values = urllib.urlencode(data) 
url = 'http://www.example.com/example.cgi' 
full_url = url + '?' + url_values 
data = urllib2.urlopen(full_url)