我有一個自定義404頁面,有兩個主要目標:妥善處理了404找不到文件要求
- 日誌404錯誤,所以我可以修復損壞的鏈接,找到邪惡的人尋找漏洞
- 重定向到適當的位置與301移動永久頁面實際已移動
其他一切只是重定向到主頁面。我遇到的問題是機器人。谷歌是最糟糕的,他們每隔幾天就不斷嘗試抓取不存在的頁面。我甚至試圖將頁面添加爲禁止到我的robots.txt,但他們由於某種原因而忽略它。這些網頁仍然在搜索結果中出現!
我想解決這個問題,所以我正在尋找建議。請注意,這是付費虛擬主機,因此更改網絡服務器設置可能不是一種選擇。該Web服務器運行的是Windows使用IIS 7
我有一些問題:
如果我發現的Googlebot(和其他幾個主要的機器人)和手動發送404個狀態碼,並試圖將網絡服務器陷阱重新執行自定義404頁面,然後進入無限循環。
如果我有頁打印一條消息,它與200
你聽起來像你知道你在說什麼,但以防萬一,你知道robots.txt不會立即註冊?我的意思是Google仍然會顯示這些頁面,直到它更新其列表爲止:-) – 2012-03-22 12:46:58
是的,我知道它需要一點時間,它只是令人討厭。我認爲問題的一大部分是刮板,它們在處理網址時做得不好,然後Google抓取它們並給我們留下錯誤的印象。 – steveo225 2012-03-22 13:41:17