我想從下面的網址刮取數據。但硒driver.get(url)
失敗有時錯誤是[Errno 104] Connection reset by peer
,有時[Errno 111] Connection refused
。 在罕見的日子裏,它工作得很好和我的Mac與真正的瀏覽器相同的蜘蛛工作正常每一次。所以這和我的spider
沒有關係。硒無頭瀏覽器webdriver [Errno 104]連接重置由對端
已經嘗試了許多解決方案,如等待頁面上的選擇器,隱式等待,使用硒請求喲傳遞適當的請求標頭等,但似乎沒有任何工作。
http://www.snapdeal.com/offers/deal-of-the-day
https://paytm.com/shop/g/paytm-home/exclusive-discount-deals
我使用python
,selenium
& headless Firefox webdriver
實現這一目標。操作系統是centos 6.5
。
注意:我有很多AJAX
成功刮下一些重頁,有些在下面。
http://www.infibeam.com/deal-of-the-day.html, http://www.amazon.in/gp/goldbox/ref=nav_topnav_deals
已經花了很多天試圖調試的問題沒有運氣。任何幫助,將不勝感激。
救了我很多的期待 - 謝謝。你的意思是 – SteveJ