12
A
回答
14
要知道,有沒有真正的官方標準,任何網絡爬蟲可以愉快地忽略你的robots.txt
據a Google groups post,以下的作品至少有Googlebot的;
User-agent: Googlebot
Disallow: /directory/
Allow: /directory/subdirectory/
2
如果這些都是真正的目錄,那麼接受的答案可能是您最好的選擇。但是,如果您正在編寫應用程序並且目錄是動態生成的路徑(例如上下文,路由等),那麼您可能想要使用元標記而不是在robots.txt中定義它。這爲您提供了無需擔心不同瀏覽器如何解釋/優先訪問子目錄路徑的優勢。
你可以嘗試這樣的事情代碼:
if is_parent_directory_path
<meta name="robots" content="noindex, nofollow">
end
1
我會建議使用谷歌的機器人測試儀。利用谷歌網站管理員工具 - https://support.google.com/webmasters/answer/6062598?hl=en
您可以在工具中編輯和測試URL,並且您還可以獲得大量其他工具。
相關問題
- 1. Robots.txt不允許subdirectoy,但允許在該文件夾
- 2. 不允許文件夾瀏覽但允許文件請求(Apache)
- 3. Htaccess不允許訪問文件夾和子文件夾
- 4. 允許子文件夾在.hgignore
- 5. robots.txt:如何禁止所有子目錄,但允許父文件夾
- 6. 如何拒絕父文件夾訪問子文件夾,但仍然允許直接訪問子文件夾?
- 7. robots.txt的:不允許子目錄,但允許目錄
- 8. 允許主域名和不允許通過.htaccess訪問子文件夾
- 9. 不允許使用robots.txt的文件夾組
- 10. gitignore允許某個文件只在命名的子文件夾
- 11. 不允許文件夾訪問
- 12. 如何通過子域只允許子文件夾exculsive訪問
- 13. robots.txt文件不允許選項
- 14. robots.txt文件不允許根目錄wordpress
- 15. 爲什麼Eclipse不允許我正確創建子文件夾?
- 16. CodeIgniter 2不允許控制器的多級子文件夾
- 17. CORS htaccess只允許某些URL到文件夾和子文件夾的AJAX
- 18. 拒絕訪問文件夾,但允許訪問該文件夾內的文件
- 19. 允許在laravel公用文件夾
- 20. 允許NGINX寫入文件夾/ xibo/*
- 21. 規則,允許在.htaccess文件夾
- 22. 允許訪問使用htaccess文件夾
- 23. 重定向到子文件夾,但允許訪問其他子文件夾,如果用的.htaccess
- 24. Eclipse'允許源文件夾的輸出文件夾'
- 25. 允許訪問Codeigniter中的\ application \文件夾內的文件夾
- 26. 允許和禁止在robots.txt文件中
- 27. 的.htaccess允許特定的子文件夾只有
- 28. 允許從根目錄子文件夾索引htaccess
- 29. WordPress允許直接訪問上傳/子文件夾
- 30. 電子只允許保存到文件夾
我想動態地允許子目錄,但不是第一級,將允許語句改爲「允許:/目錄/ * /'的作品。 – Duncanmoo
根據robots.txt維基百科條目,'允許'指令應放在'不允許'之前,以達到最大兼容性(儘管Google或Bing都不介意) – pelms