2011-08-01 120 views
0

Google已經開始抓取我的網站,但是來自臨時域(beta.mydomain而不僅僅是mydomain),而且我只希望他抓取我的一些網頁。因此,我想停止抓取並只讓他們抓取我在網站地圖中指定的網頁。我怎樣才能做到這一點? (我知道如何添加一個站點地圖,但我怎樣才能阻止他們當前的抓取,並要求他們只抓取站點地圖)停止Google抓取我的網站

更新:如果我殺死了子域beta.mydomain - 會是「罰款」他們還是會繼續瀏覽所有被殺的頁面並且「不喜歡」他們?我可以在每個頁面的標題中指定它嗎?

+0

看看使用robots.txt文件。只需谷歌,並閱讀有關它。 – dehlenbe

回答

1

您可以從robots.txt文件開始。

See google's info here

我想你已經看過網站管理員工具和網站地圖,從你說什麼?請注意,雖然網站地圖會幫助告訴谷歌要抓取的內容,但告訴他們哪些內容無法抓取並不會很好。

爲此,您需要使用robots.txt文件來阻止某些頁面/文件夾。

+0

將使用robots.txt阻止所有頁面併爲網站地圖提供特定頁面嗎? – Noam

2

在您的站點的根文件夾中創建一個名爲'robots.txt'的單個文本文件。裏面...

User-agent: * 
Disallow: /thisfolder/ 
Disallow: /foo.html 
Disallow: /andthisfoldertoo/ 
Disallow: /andthisfile.html 

我把它用於項目文件。事實上,正如我寫這篇文章,我想我會改變我的項目的工作方式,並始終把他們叫做/項目/ PROJECT1 /這樣一個行會做一個子目錄...

Disallow: /projects/ 

AND我也爲我的圖像文件添加一行。我不喜歡我的圖片在網上...

Disallow: /imgs/