許多網頁使用onload JavaScript來操作它們的DOM。有沒有一種方法可以在這些JavaScript操作之後自動訪問HTML的狀態?onload後的HTML狀態javascript
一個像wget一樣在這裏沒有用,因爲它只是下載原始源代碼。 有沒有可能使用Web瀏覽器渲染引擎的方法?
理想情況下,我正在使用一種可以與Python接口的解決方案。
謝謝!
許多網頁使用onload JavaScript來操作它們的DOM。有沒有一種方法可以在這些JavaScript操作之後自動訪問HTML的狀態?onload後的HTML狀態javascript
一個像wget一樣在這裏沒有用,因爲它只是下載原始源代碼。 有沒有可能使用Web瀏覽器渲染引擎的方法?
理想情況下,我正在使用一種可以與Python接口的解決方案。
謝謝!
我知道做這種事情的唯一好方法是自動瀏覽器,例如通過Selenium RC。如果你不知道如何推斷頁面已經完成運行相關的javascript,那麼,只是一個真正的用戶訪問該頁面,你只需要等待一段時間,抓住一個快照,等待一些,抓住另一個,並檢查他們之間沒有變化,以說服自己,它真的完成。
你到底想幹什麼?我不確定是否有任何js和python播放的可能性; D – 2009-09-17 01:12:02
某些屏幕抓取。似乎有一個Java解決方案:HtmlUnit – hoju 2009-09-17 04:59:54
似乎是可能的,但很難:http://mail.python.org/pipermail/python-list/2009-March/706800.html – hoju 2009-09-17 05:12:44