2015-10-16 94 views
0

我在downloadig URL中遇到問題。在沒有urllib的情況下在Python中下載URL

我需要下載帶表格的網頁。當我在urlliburllib2的幫助下獲得.html文件時,它有一些與javascript(或相同語言)相關的問題。只有源代碼,如id_name e.t.c,但它沒有任何表信息(列和行)。然而,當我在Google Chrome中保存.html時,它實際上具有表格中的信息(不是源代碼,而是列和行)。那麼我應該怎麼做才能在Python中實現呢?

+3

它可能會被javascript填充 – DreadfulWeather

+1

正如@DreadfulWeather所說,頁面可以使用異步查詢來填充內容,所以你可以使用瀏覽器的調試器來檢查網絡查詢。一旦找到包含內容的查詢,就可以使用該查詢的URL通過urllib下載 –

回答

2

您可以使用selenium來模擬瀏覽器。它會執行javascript然後你可以得到你想要的信息

相關問題