2009-07-07 52 views
2

我正在與客戶端合作將網站從現有生產硬件遷移到新的硬件環境。現在看起來像是一個很好的時間來執行審計並刪除任何舊的或過時的內容,而不是盲目複製它。網站內容清理工具?

是否有我可以使用一臺服務器上的實際文件的網絡訪問的內容比較的服務器上看到的內容實際上是被鏈接什麼和使用的任何好的免費工具或腳本?

在此先感謝您的幫助!

回答

0

我敢肯定是有的,但我敢肯定,沒有一個是可以做的比你可以自己一個更好的工作,你知道?這個網站有多大,你自己編碼?

+0

該網站是非常大的,在2-3000頁,再加上所引用的圖片和文件的範圍內的某處。手工操作不太實際。 我可以寫一個腳本來解析每一頁,提取鏈接並檢查它們直到完成,記錄每個找到的頁面。然後與文件系統進行比較,但這需要很長時間。 我不是第一人,要做到這一點,所以我想肯定會有一些免費或開源的工具,可以幫助,我只是不知道的人。 – 2009-07-07 09:06:14

2

嗯,首先你可以使用一個工具,如Xenu's Link Sleuth蜘蛛所有頁面發現斷開的鏈接等。我們在我們的Intranet上使用此工具來查找並修復我們斷開的鏈接。它是免費的,並完成工作。

,我們已經使用了系統之間遷移的另一個工具是一個搜索引擎。一個好的搜索引擎會抓住你的所有頁面並顯示鏈接之間的雙向關係。這可以幫助您找到哪些內容與最多的鏈接以及哪些內容可能是孤立的。不幸的是,這類的工具不是免費的。