2012-08-22 40 views
1

我有一些情況即將到來。由於完整的網站結構重新設計基本上是不可行的,我希望我們的網站地圖大約有12,000個網址,其中約90-95%的網址有變化。在這12,000箇中,我預計大約有5000-6000個內部鏈接在這個過程中死亡。這個網站還沒有外部鏈接,因爲它仍在開發中。嚴重404's,批量重定向

是否有一個工具,我可以在重構後提供sitemap.xml並讓它解析每個頁面的404錯誤,並且只報告頁面/錯誤?

我發現了一些工具,但它們都似乎只限於100頁。

對於中間網站管理員有什麼建議來幫助這種情況?在這種情況下301重定向不可行。

回答

1

根據你在編程方面的經驗,這樣做不應該很難(解析sitemap.xml,查找所有鏈接,向每個鏈接發送http請求,保存狀態碼)。

如果你正在尋找一種工具,專門的,我會說你可以試試wget的(餵養它的網站地圖的URL,在這裏看到的細節:http://www.wezm.net/technical/2009/05/spider-a-site-with-wget-using-sitemap-xml/),或HTTrack

+0

試圖說的HTTrack工具;將看到哪裏需要我,謝謝! – NRGdallas