我正在使用Selenium自動加載紐約時報文章的所有評論。一旦他們被加載,我想獲得評論並存儲該信息以便以後使用。但是,在查看文章的源代碼時,我發現註釋DIV是空的,所以NYT可能會使用javascript實時動態填充註釋。由於註釋並不在源代碼中,因此我不確定如何在Firebug中看到註釋的代碼。我認爲,我想要的是DOM,但任何幫助將不勝感激!使用Selenium獲取已填充javascript的DIV的內容
謝謝!
我正在使用Selenium自動加載紐約時報文章的所有評論。一旦他們被加載,我想獲得評論並存儲該信息以便以後使用。但是,在查看文章的源代碼時,我發現註釋DIV是空的,所以NYT可能會使用javascript實時動態填充註釋。由於註釋並不在源代碼中,因此我不確定如何在Firebug中看到註釋的代碼。我認爲,我想要的是DOM,但任何幫助將不勝感激!使用Selenium獲取已填充javascript的DIV的內容
謝謝!
var content = document.getElementById('myDivId').innerHTML;
這基本上是如何從HTML元素中檢索html內容的。
不會幫助硒。 – epascarello 2012-01-05 22:19:37
@epascarello:爲什麼不呢?你總是可以使用Selenium的'getEval'方法在頁面上執行那段JavaScript。 – slebetman 2012-01-06 02:33:31
爲什麼在構建獲取內容的方法時使用getEval? – epascarello 2012-01-06 15:29:30
使用Web驅動程序?你弄清楚他們是如何加載它的?它依靠滾動位置嗎? – epascarello 2012-01-05 22:20:08
使用IDE,但我想我可能需要切換到Web驅動程序用於這些目的。不知道他們是如何加載的,但我的教授認爲它可能與JavaScript。滾動位置似乎不成問題。 – olivebeq 2012-01-06 15:16:48