我需要刮掉一個網頁,這是一個javascript呈現的AngularJS應用程序。該網站的開發人員以隱私瀏覽模式檢測Safari/Firefox,並禁止使用它,因此被刮掉。當您不在私人模式下時,該頁面適用於Safari/Firefox。Scrapy可以與Chrome瀏覽器一起使用嗎?
有趣的是,在私人模式下使用Chrome時沒有給出這樣的警告。我正在使用Scrapy + Selenium,但我真的希望使用ScrapyJS/Splash來完成此項目。但是,看起來Scrapy/Splash組合受到網站隱私瀏覽牆的影響。
是否可以告訴Scrapy使用Chrome?我知道Selenium有很多驅動程序,關於如何使用每個驅動程序都有很好的文檔記錄,但是如果Scrapy支持其他瀏覽器或者其他人已經這樣做了,我找不到任何信息。谷歌/搜索引擎搜索也沒有爲我說明這一點。
您是否嘗試更改用戶代理? http://stackoverflow.com/questions/18920930/scrapy-python-set-up-user-agent –
是的,我在Scrapy'settings.py'文件中試過這個,它似乎沒有效果。我嘗試了一些已知的Chrome/Firefox/Safari代理以及一些「Scrapy成爲好公民」的用戶代理。 – Randy
您是否嘗試過使用硒的'chrome driver'? – Rahul