2012-02-04 87 views
1

我正嘗試使用urllib2從網站獲取網頁。在我設法登錄並檢索頁面後,我發現頁面裏面有一些<script>.....</script>。如何保存呈現的輸出(網頁的完整內容,而不是腳本)?如何在python中獲取完整的網頁(使用javascript)

+0

你是否說過在任何包含的Javascript已經運行後,你想保存頁面的內容? – 2012-02-04 17:42:51

+0

你是在做這個測試,屏幕抓取一個應用程序,或者是什麼?一般來說,使用JavaScript創建頁面內容的瀏覽器,所以你需要一個真正的瀏覽器來複制... – 2012-02-04 17:44:32

+0

@MattLuongo是的,我試圖從一個沒有提供我的個人信息一個API。 – CyberSnoopy 2012-02-04 17:47:32

回答

1

我也想提pywebkitgtk(我一直在使用一個最近很多是嵌入式瀏覽器)和Selenium

+0

硒與實際的瀏覽器驅動程序是非常有用的,可以模仿大多數人的交互。 – CyberSnoopy 2012-02-04 20:06:41

3

如果您使用的是urllib,則JavaScript無法輕鬆處理。

你需要的是一個無頭瀏覽器,例如。 WebKit的。

一個簡單的例子可以發現here.

如果你不希望自己侷限於蟒蛇,嘗試Phantomjs

相關問題