2013-03-25 37 views
0

Python noobie在這裏。使用硒與Python提取JavaScript生成的HTML?螢火蟲?

我有什麼是數據收集問題。我在這個網站上,當我用Firebug檢查我想要的元素時,它會顯示包含我需要的信息的源代碼。然而,常規的源代碼(沒有Firebug)不會給我這個信息。這意味着我也無法使用普通的硒HTML抓取數據。

我想知道是否有一種方式,硒可以像Firebug那樣獲取這些數據 - 我猜這是在用javascript或jquery加載頁面後生成的HTML。

這裏有一個畫面: http://i.imgur.com/CXLOHYx.png

你可以看到我想要的信息是「灰色」,不像其他大部分HTML的存在。也許這對於真正的數據來說是一個很好的線索。

回答

0

嘗試使用下面的代碼,看看它是否工作。

import selenium.webdriver.support.ui 

element = WebDriverWait(driver, 10).until(
     lambda driver : driver.find_element_by_xpath("fImageMap > area:nth-child(2)") 
) 
+0

是python嗎?它告訴我WebDriverWait沒有定義。我有'進口硒'和'從硒進口webdriver' – user1472747 2013-03-25 23:29:54

+0

嘗試導入,以及它是否有效。 – EsotericNonsense 2013-03-26 02:32:28

+0

我認爲你應該閱讀以下問題的答案,它可以幫助你解決你的問題。 http://stackoverflow.com/questions/8917785/python-webdriver-wait – EsotericNonsense 2013-03-26 02:36:07