Q
減慢蜘蛛網址
5
A
回答
14
如果您指的是Google,則可以通過使用Google網站管理員帳戶(Google Webmaster Tools)來遏制Google在您的網站上搜索您網站的速度。
還有這個,你可以把在爬行延遲被指定爲每個頁面抓取之間的秒數的robots.txt
User-agent: *
Crawl-delay: 10
。當然,與robots.txt中的其他內容一樣,爬蟲必須尊重它,所以YMMV。
0
5
除了使用谷歌網站管理員工具中的Googlebot(見羅伯特·哈維的答案),Yahoo!和Bing支持非標準Crawl-delay
指令在robots.txt
:
http://en.wikipedia.org/wiki/Robots.txt#Nonstandard_extensions
當推來推,然而,一個行爲不正常的殭屍程序只會在更高級別上被阻塞(例如負載平衡器,路由器,緩存代理,任何適合您的架構的代理)。
2
有關使用Perl的解決方案,請參閱Throttling your web server。 Randal Schwartz表示,他使用這種解決方案倖存了Slashdot攻擊。
相關問題
- 1. Scrapy - 蜘蛛抓取重複網址
- 2. 從蜘蛛(Scrapy)無法獲取網址
- 3. asp.net(網絡蜘蛛)
- 4. 最佳網站蜘蛛?
- 5. 蜘蛛不爬行網頁
- 6. Highchart蜘蛛網圖表
- 7. 阻止網絡蜘蛛
- 8. 蜘蛛網圖Ruby on Rails
- 9. 如何繪製蜘蛛網
- 10. scrapy:蜘蛛中的小蜘蛛?
- 11. Scrapy的Scrapyd調度蜘蛛太慢
- 12. Scrapy關閉蜘蛛如果沒有網址爬行
- 13. Scrapy蜘蛛無法找到上點擊加載網址
- 14. Scrapy蜘蛛,只能抓取一次網址
- 15. 蜘蛛是否只抓取站點地圖中的網址
- 16. 在蜘蛛情節
- 17. Scrapy DOMAIN_NAME的蜘蛛
- 18. Python的scrapy蜘蛛
- 19. 製作蜘蛛restarable
- 20. 佈局像蜘蛛
- 21. Scrapy與Scrapy蜘蛛
- 22. 使用vb.net的網絡爬蟲/蜘蛛
- 23. 在「蜘蛛網」內獲取矩形?
- 24. Highchart蜘蛛網絡圖,pointPlacement和tickInterval
- 25. Python網絡蜘蛛:如何解決captcha?
- 26. 網絡蜘蛛需要的幫助
- 27. 未知的ZAP蜘蛛網結果
- 28. JQuery中的蜘蛛網圖表
- 29. 爬蟲/蜘蛛檢測新網站
- 30. 製作網絡爬蟲/蜘蛛
你爲什麼要慢下來? – 2010-01-29 22:12:48