2013-10-21 72 views
0

一些網站似乎完全依靠javascript來生成他們的網頁。作爲用戶,我們甚至不會看到最終的「真實」HTML輸出。例如,如果您打開一個聯邦快遞跟蹤頁面< https://www.fedex.com/fedextrack/?tracknumbers=YOUR_TRACKING_NUMBER>,並查看其源代碼頁(Chrome瀏覽器中的< view-source:https://www.fedex.com/fedextrack/?tracknumbers=YOUR_TRACKING_NUMBER>),則只能看到一些javascript代碼。分析JavaScript生成的網頁

問題:我們如何分析這樣的網頁?例如,我們如何開發程序來自動重構輸出HTML?

回答

2

您可以使用無頭網頁瀏覽器重建DOM。這裏有一個例子:Phantom JS

或者,您可以使用Selenium來編寫實際的Web瀏覽器。