2011-11-18 51 views
4

我正在使用Python中的屏幕抓取工具。但是,當我瀏覽網頁的源代碼時,我注意到大部分數據都是通過Javascript實現的。在Python中屏幕抓取基於Javascript的網頁

任何想法,如何刮基於JavaScript的網頁? Python中的任何工具?

感謝

+3

爲什麼不直接使用JavaScript? – Triptych

+2

重複http://stackoverflow.com/questions/2148493/scrape-html-generated-by-javascript-with-python – hymloth

+0

爲什麼你會直接使用JavaScript?例如,你如何從Python中調用JS函數'JS_Function(var1,var2,var3)'? – Kiran

回答

5

刮基於JavaScript的網頁可能與selenium。特別是,請嘗試Selenium WebDriver

+0

我試過Selenium。我不想模仿用戶操作。正如我從運行示例程序中看到的那樣,它會打開瀏覽器窗口並模仿操作。我不要那個。我想從網頁中提取數據到我的代碼中。 – Kiran

+0

如果您不需要,您不必模仿用戶操作。只需下載頁面並解析它。使用硒的要點是它爲您處理JavaScript。 – unutbu