我檢查了日誌,發現搜索引擎訪問了我網站上的很多僞造網址。他們很可能來自很多鏈接被改變之前,即使我已經做了301重定向,一些鏈接已經以非常奇怪的方式被改變,並且不被我的.htaccess文件識別。告訴搜索引擎該頁面不存在
所有請求都由index.php處理。如果由於錯誤的URL而無法創建響應,則會顯示自定義錯誤頁面。隨着簡化代碼的index.php看起來像這樣
try {
$Request = new Request();
$Request->respond();
} catch(NoresponseException $e) {
$Request->presentErrorPage();
}
我才意識到,這個頁面會返回一個狀態200告訴機器人,該頁面是有效的,即使事實並非如此。
是否有足夠的添加與在catch語句404頭告訴機器人停止訪問該頁面?
像這樣:
header("HTTP/1.0 404 Not Found");
它看起來不錯,當我測試它,但我擔心的是SE機器人(也許用戶代理)將發生混亂。
謝謝!而且你指出了這種可能性!除非沒有人有不同的意見,否則我對你的答案感到滿意,並且會對它進行幾天的測試。 – Anders