上午解析手動使用下面的代碼所有標籤不是用Python
request = urllib2.Request(urllink, None, {'User-Agent':'Mosilla/5.0 (\
Macintosh; Intel\
Mac OS X 10_7_4) AppleWebKit/536.11 (KHTML, like Gecko) \
Chrome/20.0.1132.57 Safari/536.11'})
urlfile = urllib2.urlopen(request)
page = urlfile.read()
soup = BeautifulSoup(page)
上午發生urllink顯示HTML網頁。這裏的問題是我不從,
page = urlfile.read()
獲取整個網頁,我可以看到許多HTML內容,如果我使用「保存網頁爲選擇」保存的頁面。後來我才知道網頁在內部發送了很多請求。我怎樣才能得到整個頁面或我可以得到這些請求的網址?
請幫我
Ghost.py有一些相當差的支持。你有其他的選擇嗎? – User