2009-09-17 36 views
1

許多網頁使用onload JavaScript來操作它們的DOM。有沒有一種方法可以在這些JavaScript操作之後自動訪問HTML的狀態?onload後的HTML狀態javascript

一個像wget一樣在這裏沒有用,因爲它只是下載原始源代碼。 有沒有可能使用Web瀏覽器渲染引擎的方法?

理想情況下,我正在使用一種可以與Python接口的解決方案。

謝謝!

+0

你到底想幹什麼?我不確定是否有任何js和python播放的可能性; D – 2009-09-17 01:12:02

+0

某些屏幕抓取。似乎有一個Java解決方案:HtmlUnit – hoju 2009-09-17 04:59:54

+0

似乎是可能的,但很難:http://mail.python.org/pipermail/python-list/2009-March/706800.html – hoju 2009-09-17 05:12:44

回答

2

我知道做這種事情的唯一好方法是自動瀏覽器,例如通過Selenium RC。如果你不知道如何推斷頁面已經完成運行相關的javascript,那麼,只是一個真正的用戶訪問該頁面,你只需要等待一段時間,抓住一個快照,等待一些,抓住另一個,並檢查他們之間沒有變化,以說服自己,它真的完成。