我是python的新手,我正在嘗試學習一些新的模塊。幸運的是,不幸的是,我拿起urllib2模塊,並開始使用它與一個URL導致我的問題。關於在python中處理重定向
首先,我創建了Request對象,然後在響應對象上調用Read()。這是失敗的。發現它獲得重定向,但錯誤代碼仍然是200.不知道發生了什麼事。這裏是代碼 -
def get_url_data(url):
print "Getting URL " + url
user_agent = "Mozilla/5.0 (Windows NT 6.0; rv:14.0) Gecko/20100101 Firefox/14.0.1"
headers = { 'User-Agent' : user_agent }
request = urllib2.Request(url, str(headers))
try:
response = urllib2.urlopen(request)
except urllib2.HTTPError, e:
print response.geturl()
print response.info()
print response.getcode()
return False;
else:
print response
print response.info()
print response.getcode()
print response.geturl()
return response
我打電話上述功能與http://www.chilis.com」
我期待收到301,302,303或而是我看200。這裏是我的反應看 -
Getting URL http://www.chilis.com
<addinfourl at 4354349896 whose fp = <socket._fileobject object at 0x1037513d0>>
Cache-Control: private
Server: Microsoft-IIS/7.5
SPRequestGuid: 48bbff39-f8b1-46ee-a70c-bcad16725a4d
X-SharePointHealthScore: 0
X-AspNet-Version: 2.0.50727
X-Powered-By: ASP.NET
MicrosoftSharePointTeamServices: 14.0.0.6120
X-MS-InvokeApp: 1; RequireReadOnly
Date: Wed, 13 Feb 2013 11:21:27 GMT
Connection: close
Content-Length: 0
Set-Cookie: BIGipServerpool_http_chilis.com=359791882.20480.0000; path=/
200
http://www.chilis.com/(X(1)S(q24tqizldxqlvy55rjk5va2j))/Pages/ChilisVariationRoot.aspx?AspxAutoDetectCookieSupport=1
有人能解釋一下這個網址有,如何處理這個我知道我可以使用從Diveintopython.net「處理重定向」部分也與該網頁我看到的代碼?相同的反應200.
編輯:使用從DiveintoPython的代碼,我看到它的臨時重定向。我不明白的是爲什麼代碼中的HTTP錯誤代碼是200.這不是真的返回代碼嗎?編輯2:現在我看到它更好,它不是一個奇怪的重定向。我正在編輯標題。編輯3:如果urllib2自動執行重定向,我不確定爲什麼下面的代碼沒有得到chilis.com的首頁。
docObj = get_url_data(url)
doc = docObj.read()
soup = BeautifulSoup(doc, 'lxml')
print(soup.prettify())
如果我使用的瀏覽器終於結束了被重定向到它的工作原理(http://www.chilis.com/EN/Pages/home.aspx「)。
@Martijn謝謝! – R11 2013-02-13 11:36:11