2014-01-10 62 views
-3

我需要保存一個網頁。使用機械化,我可以保存根頁面的HTML。但是,在加載頁面後會運行許多腳本,並使用我希望保存到文件的數據填充頁面的多個部分。編程保存網頁所有加載腳本運行後

我很確定我已經看到有一個圖書館存在這個,但我不記得名字,也沒有找到它在我的無數的搜索。我想我看到有一個庫像Web瀏覽器一樣運行,允許它加載頁面,運行需要運行的任何JS腳本,然後返回最終頁面,就像在真實的瀏覽器中顯示的一樣。

我不確定它是Python 2還是3,但兩者都可以工作。

回答

0

我想我找到了我正在尋找的東西。 Selenium!它在Python中也有一個package。如果這確實是我正在尋找的內容,請更新此答案和社區可搜索性問題。

+0

FWIW請參閱[praveen](http://stackoverflow.com/a/21037397/1007939)的答案。正是我發現的,也許是我記得的回答 – CDspace