無法下載整個html頁面

正如我的標題可能表明我正在嘗試使用腳本顯示和下載html頁面。我已經嘗試了不同的python（和ActionScript 3）方法，但他們都沒有實際顯示網站上的整個可見內容。無法下載整個html頁面

但是他們都表現出一定的javascipt的代碼

有一些方法可以讓我能查出可見的內容（我要下載動態由JavaScript創建的網頁）？我想要的功能類似於「全選 - 複製」 - windows方法。

2014-02-20 user3257755

您需要使用[支持JavaScript的瀏覽器模擬器]（http://stackoverflow.com/q/21777306/190597）。 – unutbu

機械化？ http://wwwsearch.sourceforge.net/mechanize/ – markcial

我真的在Python中使用這個包安裝功能時遇到麻煩。我想我已經成功安裝了pip，但是在使用pip安裝lxml時，我得到了很多標準的cmd回顯，直到「C：\ Python33 \ lib \ distutils \ dist.py：258：UserWarning：Unknown distribution option：'extra-require' 」。以下很多類似的錯誤... – user3257755

既然你寫

我想要的功能類似於「全選 - 複製」 - 窗口方法。

我知道你想下載網頁的「源代碼」。如果這是你想要的，那麼這就是你需要做的。

import urllib.request 
import re 

urls = ["http://google.com","http://yahoo.com"]; 

i=0; 
while i < len(urls):  
    htmlfile = urllib.request.urlopen(urls[i]); 
    htmltext = htmlfile.read(); 
    print(htmltext); 
    print("\n"); 
    i=i+1;

它讀取URL和打印他們的源代碼。

來源

2014-02-25 13:10:40

無法下載整個html頁面

回答

相關問題