2010-07-13 151 views
0

因此我正在將舊網站傳輸到新服務器,並嘗試在此過程中進行清理。如何跟蹤網站內的鏈接

我所尋找的是某些腳本或免費的軟件,它可以:

一)表明通過網站(路徑跟蹤超鏈接等),所以我可以看到鏈接到什麼

和b)一些軟件可以查看文件夾結構中哪些html文件是孤兒(未鏈接到)。

與一個或兩個的這些任何幫助,將不勝感激:)

+0

我發現了http://home.snafu.de/tilman/xenulink.html(Xenulink)顯示路徑 - 仍然不確定在哪裏可以找到顯示孤立頁面的軟件,儘管 – simonalexander2005 2010-07-13 13:33:21

回答

0

home.snafu.de/tilman/xenulink.html(Xenulink)提供鏈路蜘蛛,並用FTP訪問,孤兒文件檢查。

1

http://haveamint.com/說,這一切,美麗的圖形用戶界面,簡單集成,重量輕,數據庫存儲,JavaScript跟蹤。

有薄荷(Y)

或者你也可以使用谷歌分析的女巫這些天

幾乎所用的每一個網站
+0

我應該添加了告誡「免費」 – simonalexander2005 2010-07-13 13:30:00

+0

然後只需與谷歌分析與自定義鏈接跟蹤。 – RobertPitt 2010-07-13 14:04:19

1

一)表明通過網站的路徑(以下超鏈接等等),所以我可以看到什麼鏈接到什麼

所以基本上是一個爬蟲?你可以用一個http庫,一個html解析器和任何品牌的腳本語言把東西攪起來。但我不知道任何現成的腳本。

和b)一些軟件,可以看到文件夾結構中的哪些html文件是孤兒(未鏈接到)。

您的網站是否包含純html文件,或者是否存在某種服務器端技術,例如PHP?如果是這樣,則不能自動檢測所述孤兒,因爲它們是作爲服務器端應用程序的函數生成的,並不是實際的頁面,儘管它們可能在瀏覽器中顯示。

+0

不,他們只是HTTP頁面 - 它只是一個小東西:) – simonalexander2005 2010-07-13 13:44:50

+0

你的意思是HTML頁面? – troelskn 2010-07-13 15:35:57

+0

對不起,是的 - 儘管我最近意識到JavaScript中也包含一些鏈接... – simonalexander2005 2010-07-14 09:06:51

1

a)取決於您網站的複雜程度以及內容的動態性,您可以下載任何蜘蛛並將其限制到您的wevsite並檢查結果(「burp suite」包含一個非常好的蜘蛛,並且都是一個工具每個人都應該知道)。

b)蜘蛛完成其工作後,檢查wevsites目錄中所有文件的訪問時間,訪問時間早於蜘蛛執行時間的任何文件可能都是孤兒。

(這兩種解決方案將是一個網站,利用用戶輸入reffer到網頁上效果較差)