我需要保存一個網頁。使用機械化,我可以保存根頁面的HTML。但是,在加載頁面後會運行許多腳本,並使用我希望保存到文件的數據填充頁面的多個部分。編程保存網頁所有加載腳本運行後
我很確定我已經看到有一個圖書館存在這個,但我不記得名字,也沒有找到它在我的無數的搜索。我想我看到有一個庫像Web瀏覽器一樣運行,允許它加載頁面,運行需要運行的任何JS腳本,然後返回最終頁面,就像在真實的瀏覽器中顯示的一樣。
我不確定它是Python 2還是3,但兩者都可以工作。
我需要保存一個網頁。使用機械化,我可以保存根頁面的HTML。但是,在加載頁面後會運行許多腳本,並使用我希望保存到文件的數據填充頁面的多個部分。編程保存網頁所有加載腳本運行後
我很確定我已經看到有一個圖書館存在這個,但我不記得名字,也沒有找到它在我的無數的搜索。我想我看到有一個庫像Web瀏覽器一樣運行,允許它加載頁面,運行需要運行的任何JS腳本,然後返回最終頁面,就像在真實的瀏覽器中顯示的一樣。
我不確定它是Python 2還是3,但兩者都可以工作。
該庫是selenium。 http://www.youtube.com/watch?v=g54xYVMojos是一段時間我看到硒在行動中的視頻。請參閱我的回答How to load all entries in an infinite scroll at once to parse the HTML in python查看硒的樣本用法
+1我嘗試了更多的搜索,並發現了確切的,但未經測試尚未確認。我會給你答案,並感謝你的確認。 Grats! – CDspace