2014-02-12 67 views
0

我無法找到有關我的案例的信息。我想限制以下類型的URL來進行索引:robots.txt類別URL的限制

website.com/video-title/video-title/

(我的網站產生我的視頻,文章的這種雙重網址拷貝)

每個視頻文章都以URL開頭的單詞「video」開頭。

所以我想要做的是限制有website.com/"any-url"/video-any-url所有URL」

這樣,我會刪除所有的一倍副本。可能有人幫助我

回答

0

這是不可能在原來的robots.txt規範

但是有些解析器可以支持Disallow通配符無論如何,例如,Google:?

Googlebot(但不是所有的搜索引擎)都尊重一些模式匹配。

所以對於谷歌的機器人,你可以使用下面一行:

Disallow: /*/video 

這應該阻止其路徑與任何東西開始,包括「視頻」的任何URL,例如:

  • /foo/video
  • /foo/videos
  • /foo/video.html
  • /foo/video/bar
  • /foo/bar/videos
  • /foo/bar/foo/bar/videos

其他解析器不支持該會從字面上解釋它,也就是說,它們會阻止以下網址:

  • /*/video
  • /*/videos
  • /*/video/foo