因此我正在將舊網站傳輸到新服務器,並嘗試在此過程中進行清理。如何跟蹤網站內的鏈接
我所尋找的是某些腳本或免費的軟件,它可以:
一)表明通過網站(路徑跟蹤超鏈接等),所以我可以看到鏈接到什麼
和b)一些軟件可以查看文件夾結構中哪些html文件是孤兒(未鏈接到)。
與一個或兩個的這些任何幫助,將不勝感激:)
因此我正在將舊網站傳輸到新服務器,並嘗試在此過程中進行清理。如何跟蹤網站內的鏈接
我所尋找的是某些腳本或免費的軟件,它可以:
一)表明通過網站(路徑跟蹤超鏈接等),所以我可以看到鏈接到什麼
和b)一些軟件可以查看文件夾結構中哪些html文件是孤兒(未鏈接到)。
與一個或兩個的這些任何幫助,將不勝感激:)
home.snafu.de/tilman/xenulink.html(Xenulink)提供鏈路蜘蛛,並用FTP訪問,孤兒文件檢查。
http://haveamint.com/說,這一切,美麗的圖形用戶界面,簡單集成,重量輕,數據庫存儲,JavaScript跟蹤。
有薄荷(Y)
或者你也可以使用谷歌分析的女巫這些天
幾乎所用的每一個網站我應該添加了告誡「免費」 – simonalexander2005 2010-07-13 13:30:00
然後只需與谷歌分析與自定義鏈接跟蹤。 – RobertPitt 2010-07-13 14:04:19
一)表明通過網站的路徑(以下超鏈接等等),所以我可以看到什麼鏈接到什麼
所以基本上是一個爬蟲?你可以用一個http庫,一個html解析器和任何品牌的腳本語言把東西攪起來。但我不知道任何現成的腳本。
和b)一些軟件,可以看到文件夾結構中的哪些html文件是孤兒(未鏈接到)。
您的網站是否包含純html文件,或者是否存在某種服務器端技術,例如PHP?如果是這樣,則不能自動檢測所述孤兒,因爲它們是作爲服務器端應用程序的函數生成的,並不是實際的頁面,儘管它們可能在瀏覽器中顯示。
不,他們只是HTTP頁面 - 它只是一個小東西:) – simonalexander2005 2010-07-13 13:44:50
你的意思是HTML頁面? – troelskn 2010-07-13 15:35:57
對不起,是的 - 儘管我最近意識到JavaScript中也包含一些鏈接... – simonalexander2005 2010-07-14 09:06:51
a)取決於您網站的複雜程度以及內容的動態性,您可以下載任何蜘蛛並將其限制到您的wevsite並檢查結果(「burp suite」包含一個非常好的蜘蛛,並且都是一個工具每個人都應該知道)。
b)蜘蛛完成其工作後,檢查wevsites目錄中所有文件的訪問時間,訪問時間早於蜘蛛執行時間的任何文件可能都是孤兒。
(這兩種解決方案將是一個網站,利用用戶輸入reffer到網頁上效果較差)
我發現了http://home.snafu.de/tilman/xenulink.html(Xenulink)顯示路徑 - 仍然不確定在哪裏可以找到顯示孤立頁面的軟件,儘管 – simonalexander2005 2010-07-13 13:33:21