2014-09-26 106 views
0


由於軟件升級,我在網站的.htaccess(約700)中達到了相當數量的重定向。我認爲其中一半現在已經被Google收錄。我如何找到當前正在使用的重定向列表?
我的想法是要找到所有的 「301」 在Apache日誌,比如這個:
查找301在我的網站上工作的重定向

1.235.117.180 - - [01/8/2014:06:41:59 +0200]「GET /組件/ com_acesearch /資產/ CSS/acesearch.css HTTP/1.1" 「http://example.com/link1/link2/page-2」「的Mozilla/5.0(Windows NT的6.1; WOW64)爲AppleWebKit/537.36(KHTML,例如Gecko)鉻/ 36.0.1985.125 Safari/537.36「

是否可以安全地假設所有沒有像上面列出的重定向一個沒有被使用(所以我可以刪除它們?)
謝謝

回答

1

不,這是不安全的,不要只依賴apache日誌。一些舊的鏈接可能仍然在索引中,並可以在以後進行爬網。

你不能優化你的重定向嗎?你能舉一些重定向的例子嗎?沒有模式嗎?使用正則表達式,如果可以找到某種模式(或幾種模式),則可以非常有效地重寫文件。

還有更多的搜索引擎只有谷歌。如果一切都保持索引很重要,我會保留重定向,但找到模式並將重定向的次數增加到最大值。 10什麼的。

+0

謝謝。那麼一些重定向已經被優化,然而其中大多數重定向不能被輕易優化,因爲新鏈接的模式已經發生了很大變化。也許我會在.htaccess郵件列表 – user2824073 2014-09-27 12:09:56

+0

上發佈其中的一些,你也可以將所有不存在的文件重寫爲一個處理所有301重定向的php文件,並將請求存儲在數據庫中,以便您可以輕鬆找出哪些舊網址仍在使用中,以及它們來自哪個搜索引擎。這將是一個性能稍差,但他們仍然是'舊'鏈接... – DaveG 2014-09-29 09:11:35