對不起,如果這是一個愚蠢的問題。通過腳本插入div的網頁抓取
我想在python中使用Beautifulsoup和urllib2來查看一個url並提取所有div與一個特定的類。但是,即使我在chrome的開發人員工具中「檢查元素」時可以看到div,結果始終爲空。
我看了看頁面的源代碼,那些div並不在那裏,這意味着它們是由腳本插入的。所以我的問題是我如何使用Beautifulsoup來查找這些div(使用他們的類名)?我想最終閱讀並遵循這些div下的hrefs。
謝謝。
[編輯] 我目前正在在H &中號網站:http://www.hm.com/sg/products/ladies和我有興趣得到所有帶班「產品列表項」的div
你可以發佈您嘗試刮的URL,以檢查它是否使用JavaScript – Wonka