我正在開展webscraping項目,並且遇到了cloudflare scrapeshield的問題。有誰知道如何解決它?我使用硒webdriver,通過scrapeshield將其重定向到一些燈光頁面。用python建立在firefox之上。瀏覽通常不會導致它重定向。 webdriver與常規瀏覽器有什麼不同嗎?繞過Cloudflare Scrapeshield
回答
請參閱scrapeshield所做的是檢查您是否使用真正的瀏覽器,它本質上是檢查您的瀏覽器是否存在某些錯誤。假設Chrome瀏覽器無法處理IFrame
,如果同時有一個303 error
,某些Web瀏覽器對不同測試的反應不同,所以webdriver不得對這些反應做出反應,導致系統說「我們有入侵者,改變頁面!「。我可能是正確的,而不是100%肯定,雖然...
更多信息源:
我發現大部分在Defcon黑客大會上談網絡嗅探器這些信息,並阻止他們在適當的漏洞信息服務器,他在PHP中也創建了一個Web瀏覽器標識符。
你還記得談話或主持人的名字嗎?今年這個defcon?我知道defcon將他們的大部分談話放在YouTube上,所以我可能能夠找到它。非常感謝。 – Namrop
我在YouTube上發現它:http://youtu.be/I3pNLB3Cq24希望鏈接能夠正常工作,但它通過網絡瀏覽器檢測對付腳本小子和掃描儀的防禦性操作。 –
「我使用硒webdriver,通過scrapeshield將其重定向到某個燈光頁面。」 - 這不是Scrapeshield的工作原理。
此外,我建議此線程關閉,因爲您要求繞過網站所有者故意決定在其網站上啓用的安全功能來阻止用戶抓取其內容。
- 1. urllib2繞過cloudflare
- 2. 繞過Cloudflare的上傳最大
- 3. 繞過CloudFlare的超時100秒
- 4. 如何繞過Scrapy中的cloudflare bot/ddos保護?
- 5. 可以Plupload繞過Cloudflare的100 MB上傳限制嗎?
- 6. 設置DNS記錄繞過Cloudflare似乎沒有任何直接影響?
- 7. Socket.io - 通過Cloudflare的SSL
- 8. 繞過
- 9. 繞過Twitter OAuth
- 10. 繞過條件
- 11. 繞過max_execution_time?
- 12. 繞過IE9 InfoBar
- 13. 繞過Page.VerifyRenderingInServerForm
- 14. PHP:session_status被繞過?
- 15. 繞過ElementTree
- 16. 繞過event.stopProgagation
- 17. Cloudflare等待超過20秒的時間
- 18. Cloudflare NS停運並且沒有Cloudflare NS3?
- 19. 繞過IncompleteRead異常
- 20. C++繞過載體
- 21. 什麼是繞過
- 22. MVC3 Ajax UpdateTargetId繞過
- 23. 繞過一個「AppendOnlyStringBuilder」
- 24. main.g.cs和app.g.cs繞過?
- 25. 繞過硒在capcha
- 26. 實現j_security_check繞過
- 27. iOS:繞過閃屏
- 28. 如何繞過IndexError
- 29. 繞過Workbook_SheetChange事件
- 30. 繞過一個requiredfieldvalidator
Boo,hiss re:尋求與內容所有者意願相違背的協助。 –