2014-02-27 95 views

回答

3

它阻止(好)機器人(例如,Googlebot)索引任何頁面。

this page

「用戶代理:*」 是指本部分適用於所有的機器人。 「不允許:/」告訴機器人它不應該訪問該網站上的任何頁面 。

使用的/robots.txt時有兩個重要的因素:

  • 機器人可以忽略你的/robots.txt。尤其是 掃描網絡中的安全漏洞的惡意軟件機器人,以及垃圾郵件發送者使用的收件人的電子郵件地址 將不予理睬。
  • /robots.txt文件是公開可用的文件。任何人都可以看到你不想讓機器人使用你的服務器的哪些部分是 。
+0

確實注意到,無論是惡意的,還是編碼不好的機器人都可能繼續併爲該網頁編制索引。 – user2366842

+0

@ user2366842我相信我已經充分說明了這一點。 – Mooseman

+0

看起來像你的編輯發生在我的帖子之前。 – user2366842

1

查看robots.txt specification

User-agent: *匹配每個支持robots.txt的機器人(並且在同一文件中沒有更具體的記錄,例如User-agent: BotWithAName)。

Disallow: /禁止這些漫遊器抓取主機上的任何東西。

請注意,並非所有機器人都支持並尊重robots.txt文件。