我一直在經歷不同的論壇,並想知道這是否正確。我試圖禁止漫遊器僅在特定的子頁面中抓取查詢(例如www.website.com/subpage/?query=sample)。我試圖確保/ subpage /也不會被拒絕。如果我錯了,請糾正我。Robots.txt Disallow方法
文件:robots.txt的
User-agent: *
Disallow: /subpage/*?
我一直在經歷不同的論壇,並想知道這是否正確。我試圖禁止漫遊器僅在特定的子頁面中抓取查詢(例如www.website.com/subpage/?query=sample)。我試圖確保/ subpage /也不會被拒絕。如果我錯了,請糾正我。Robots.txt Disallow方法
文件:robots.txt的
User-agent: *
Disallow: /subpage/*?
據我所看到的here,你是非常接近
User-agent: *
Disallow: /subpage/*?*
Allow: /subpage$
我不認爲你可以在Disallow
指定查詢字符串。您爲Disallow
設置的值在文檔中引用爲Directory
(不是URI
或URL
)。
但是,您可以通過使用Sitemap.xml
來實現您的目標。您可以從站點地圖中排除您不想索引的URL
。
Google Webmaster tools也對查詢字符串參數的解釋方式給出了一定程度的控制。不知道這是否符合您的目的
您可以隨時下載適當的[add-on](https://addons.mozilla.org/en-US/firefox/addon/user-agent-switcher/)或[extension ](https://chrome.google.com/webstore/detail/user-agent-switcher-for-c/djflhoibgkdhkhhcedjiklpkjnoahfmg?hl=en-US)從您自己的瀏覽器中測試這些東西。 –
@MisterMelancholy感謝評論:)但是,我只是想知道如果行'不允許:...'是否有效。基本上我不想讓漫遊器在「子頁面」下抓取查詢。 – Elmer