2012-10-11 44 views

回答

1

我找到了一個答案

優點: - 它很容易。只有一行

<a href="mypage.html" rel="nofollow" /> 

但缺點: -

我們的測試顯示,一些搜索引擎做的抓取和索引nofollow的鏈接。 nofollow標記可能會降低鏈接提供的排名值,但不能可靠地用於阻止搜索引擎關注鏈接。

+0

但是根據這個博客,它說nofollow支持許多搜索引擎http://antezeta.com/news/avoid-search-engine-indexing#SEI20 –

+1

有很多事情,你可以做,以確定一個基於web的,抓取工具並阻止抓取特定頁面。查看我的答案以獲取更多詳細信息:http://stackoverflow.com/questions/8404775/how-to-identify-web-crawler/8405803#8405803 – Kiril

1

您可以指定Web爬網程序不使用robots.txt文件進行爬網的鏈接。

更多在這裏學習:

http://www.robotstxt.org/

下面是一個例子。在您的應用程序的最頂層目錄中創建一個robots.txt,以便您的domain.com/robots.txt可以訪問它。

User-agent: * 
Disallow: /offensive 

這對每個用戶代理說,忽略/offensive網址。

相關問題