我正在編寫一個程序來驗證遠程服務器上的網頁。它使用硒RC通過一系列測試運行Firefox,所以我可以調用任意的JavaScript。當出現故障時,我想記錄該頁面生成的HTML。現在,訪問DOM HTML很容易,但我很難找到一種方法來獲取源代碼。謝謝。使用javascript從Firefox獲取原始源代碼
我應該重申,我不是在尋找DOM,而是原始的未經修改的源代碼。通過右鍵單擊 - >查看頁面源可以看到。特別是如果 <Html> <body> <table> <tr> <td> fear the table data </td> </table>
是真正的HTML。調用document.documentElement.outerHTML || document.documentElement.innerHTML
和selenium.getHTMLSource()
將導致<head> </head><body> <table> <tbody><tr> <td> fear the table data </td> </tr></tbody></table> </body>
我目前正在通過額外的請求使用http庫來做到這一點,所以每個頁面實際獲取兩次:使用硒和不使用。另外我經常注意到,在Firefox中查看頁面源代碼有一些滯後性,顯然瀏覽器在引擎蓋下是一樣的。 – 2016-03-01 14:54:53