有沒有辦法否認,除了一個域中的所有機器人?我希望搜索引擎不抓取,除非它是一個特定的域。的robots.txt拒絕所有除了一個域
0
A
回答
0
用戶代理:*
不允許:/
用戶代理:The robot you want to allow
允許:/
1
如果我正確理解你的意見,對方的回答,你有通配符子域名,這樣foo.example.com和bar.example.com以及fooby.example.com最終都會到達同一個地方。只有一條物理路徑爲所有這些域提供服務。
如果是這樣的話,那麼你不能用一個單一的robots.txt文件中。 robots.txt文件中的規則都基於該域名後談到東西。
我建議你在包含該目錄中創建一個robots.txt文件:
User-agent: *
Disallow:/
這將阻止任何爬行所有漫遊。
現在,假設您只允許在對foo.example.com的訪問時進行爬網,那麼我會創建一個重寫規則,以便嘗試訪問foo.example.com/robots.txt而不是從他們的數據獲取其數據foo.example.com/robots_foo.txt。該文件將包含:
User-agent: *
Disallow:
它允許訪問所有內容。當然,你可以添加你想要的任何禁止規則。
如果您不能創建重寫規則,那麼你就必須去與Sitemaps。當然,缺點是並非所有的抓取工具都瞭解Sitemaps。有些人仍然希望以舊的方式爬行。
+0
太棒了!謝謝 –
相關問題
- 1. 拒絕所有的配置文件,除了一個在Apache中
- 2. 拒絕來自除一個域以外的所有域的引薦
- 3. 拒絕所有表格給所有人,除了sa
- 4. 除了那些訪問被拒絕的所有進程被拒絕錯誤
- 5. 拒絕所有文件夾,除了/index.php和兩個文件夾
- 6. 拒絕所有的IP,但一個
- 7. 所有子域的單個robots.txt文件
- 8. SQL Server拒絕除一個用戶以外的所有用戶
- 9. MSQL拒絕所有查詢,除了存儲過程
- 10. .htacccess - 拒絕所有,排除圖像
- 11. 的.htaccess - 拒絕一切除了一個文件夾
- 12. .htaccess拒絕除了一個文件有一個重寫規則的所有文件
- 13. 重定向所有子域的主域除了一些子域
- 14. 拒絕訪問除所有Internet主機外的所有主機
- 15. 在同一個域上拒絕訪問
- 16. 的robots.txt刪除整個子域/目錄
- 17. 選擇所有領域,除了只有一個字段在MySQL
- 18. robots.txt的多個域
- 19. Cloudfront拒絕來自一個域的CORS,但沒有其他
- 20. 刪除所有目錄,除了一個
- 21. 的.htaccess拒絕所有除了支持Java腳本的訪問以及
- 22. htaccess拒絕所有的IP地址,除了在美國的那些?
- 23. .htaccess拒絕從一個html文件除外的所有文件夾的訪問
- 24. 在我的所有域中循環訪問被拒絕SET-QADUSER
- 25. 拒絕訪問除一個文件夾之外的所有文件
- 26. .htaccess拒絕訪問除一個文件以外的所有文件
- 27. Nginx:將所有子域重寫爲www,除了一個?
- 28. 拒絕訪問除了來自一個文件夾的內容以外的所有內容
- 29. 拒絕所有訪問文件,但一個ip | htaccess的
- 30. .htaccess拒絕所有 - > directoryindex不起作用(拒絕所有白名單文件)
我的應用程序可以在一個通配符子域我試圖阻止除了一個子域 –
所以,你只需要機器人來訪問您的子網域所有的機器人安裝? – m3h2014
是的,禁止其他一切 –