我有以下代碼:Python的網頁抓取暫停
#!/usr/bin/env python
from mechanize import Browser
from BeautifulSoup import BeautifulSoup
mech = Browser()
mech.set_handle_robots(False)
url = "http://storage.googleapis.com/patents/retro/2011/ad20111231-02.zip"
page = mech.open(url)
html = page.read()
soup = BeautifulSoup(html)
print soup.prettify()
真正簡單的web刮刀試圖從網頁上下載一個.zip文件。當我運行這個代碼時,記住這個文件是4kb,程序不會完成,就好像它處於無限循環中一樣。我在這裏做了什麼?
你等了多久才完成?我剛剛用'timeit'('python -m timeit -n 1 -r 1 -s「import requests」「r = requests.get('http://storage.googleapis.com/patents/retro/2011/ad20111231 -02.zip')。content「'),它花了113秒。你至少等了多久? – jdotjdot