如何讓爬蟲/機器人不索引任何具有/ node/pattern的URL? 以下是自第一天起,但我注意到,Google仍然索引了很多其中包含 /node /的網址,例如, www.mywebsite.com/node/123/32robots.txt - 排除任何包含「/ node /」的URL
不允許:/節點/
有什麼事情不索引有/節點的任何URL州/ 我應該寫類似如下: 不允許:/節點/ *
更新: 真正的問題是,儘管: 不允許:/節點/ robots.txt中,谷歌已經收錄此網址如下頁www.mywebsite.com/node/123/32
/node /不是一個物理目錄,這是drupal 6如何顯示它的內容,我想這是我的問題,節點不是目錄,只是URL的一部分由drupal爲內容生成,我該如何處理?這會工作嗎?
不允許:/ *節點
感謝
Google關於robots.txt的注意事項如下: 要阻止目錄及其中的所有內容,請使用正斜槓跟隨目錄名稱。 不允許:/垃圾目錄/ 這並不是說: 不允許:/垃圾目錄/ * 所以如果我已經寫正確的指令 不允許:/節點/ 那麼爲什麼我裏面的網頁建立索引?例如www.mywebsite.com/node/123/32 – practitioner 2012-04-13 11:53:24
您是在索引頁面之前還是之後添加了robots.txt文件? Robots.txt不時因不明原因而被搜索引擎所尊重。我更新了我的答案,以包含一個非常好的替代方法。 – 2012-04-13 13:03:20
我已更新我的問題,請再次檢查 – practitioner 2012-04-13 15:13:06