我想從獲取數據http://book.libertorrent.com/,但目前我失敗了,因爲一些額外的數據(標題)出現在響應。我的代碼是非常簡單的:Python urllib開放問題
response = urllib.urlopen('http://book.libertorrent.com/login.php')
f = open('someFile.html', 'w')
f.write(response.read())
閱讀()回報:
Date: Fri, 09 Nov 2012 07:36:54 GMT
Content-Type: text/html; charset=utf-8
Transfer-Encoding: chunked
Connection: close
Cache-Control: no-cache, pre-check=0, post-check=0
Expires: 0
Pragma: no-cache
Set-Cookie: bb_test=973132321; path=/; domain=book.libertorrent.com
Content-Language: ru
1ec0
...Html...
0
而且response.info()是空的。
有什麼方法可以糾正響應嗎?
response.read()之後,response.getcode()會說什麼?在我的Mac上,response.read()返回html,而.getcode()返回200,這是OK(成功)。 –
你的方法通常有效;當我嘗試使用該網站時,我遇到了同樣的問題... –
我也是,有趣的是它適用於Python 3. – poke