使用硒與Python提取JavaScript生成的HTML？螢火蟲？

Python noobie在這裏。使用硒與Python提取JavaScript生成的HTML？螢火蟲？

我有什麼是數據收集問題。我在這個網站上，當我用Firebug檢查我想要的元素時，它會顯示包含我需要的信息的源代碼。然而，常規的源代碼（沒有Firebug）不會給我這個信息。這意味着我也無法使用普通的硒HTML抓取數據。

我想知道是否有一種方式，硒可以像Firebug那樣獲取這些數據 - 我猜這是在用javascript或jquery加載頁面後生成的HTML。

你可以看到我想要的信息是「灰色」，不像其他大部分HTML的存在。也許這對於真正的數據來說是一個很好的線索。

2013-03-25 user1472747

嘗試使用下面的代碼，看看它是否工作。

import selenium.webdriver.support.ui 

element = WebDriverWait(driver, 10).until(
     lambda driver : driver.find_element_by_xpath("fImageMap > area:nth-child(2)") 
)

來源

2013-03-25 21:16:55 EsotericNonsense

是python嗎？它告訴我WebDriverWait沒有定義。我有'進口硒'和'從硒進口webdriver' – user1472747 2013-03-25 23:29:54

嘗試導入，以及它是否有效。 – EsotericNonsense 2013-03-26 02:32:28

我認爲你應該閱讀以下問題的答案，它可以幫助你解決你的問題。 http://stackoverflow.com/questions/8917785/python-webdriver-wait – EsotericNonsense 2013-03-26 02:36:07

使用硒與Python提取JavaScript生成的HTML？螢火蟲？

回答

相關問題