2010-04-14 20 views
1

如果我必須爲沒有站點地圖的網站創建內容庫存,並且我無權修改網站,但該網站非常大。我怎樣才能從該網站建立一個網站地圖,而不必完全瀏覽它? 我嘗試使用Visio的站點地圖構建器,但它很失敗。例如:我想創建一個Stackoverflow的站點地圖。 你們知道一個軟件來構建它嗎?用於構建站點地圖的軟件

回答

1

您必須完全瀏覽它才能搜索每個頁面以查找網站中的唯一鏈接,然後將它們放入索引中。

對於您在網站中找到的每個獨特鏈接,您還需要訪問該頁面並搜索更多獨特的鏈接。

您將使用諸如HtmlAgilityPack之類的工具來輕鬆獲取網址並從中提取鏈接。

我寫這倒是個問題的提取鏈接部分的文章:

0

我會將所有的頁面註冊到數據庫中,然後將它們全部輸出到一個頁面上(php-sql)。也許甚至索引軟件可以幫助你!首先,請確保您的所有網頁都已鏈接起來,然後將其提交給Google!

0

剛剛搜索並找到了這一個。 http://www.xml-sitemaps.com/ 看起來很有趣!

+0

這是我用於索引的事實上的網站,但它僅限於網站內的500頁。 你可以繞過這個限制,通過索引特定的子目錄,然後手動合併它們... – rtpHarry 2010-04-14 21:24:42

0

有XML站點地圖生成器的一個相當大的集合(假設這是你想要什麼生成 - 而不是HTML網站地圖頁面或其他東西?)在http://code.google.com/p/sitemap-generators/wiki/SitemapGenerators

一般來說,對於任何大型網站,最好的解決方案是真正直接抓住信息f rom來源,例如來自支持該站點的數據庫。通過這樣做,您可以獲得最準確和最新的Sitemap文件。如果您必須抓取網站以獲取站點地圖文件的URL,則需要相當長的時間才能獲得更大的站點,並且在此期間它將加載服務器(就像有人訪問站點中的所有頁面一樣)。通過不時抓取網站來確定是否存在可追溯性問題(如無盡的日曆,通過表單隱藏的內容等)是一個好主意,但如果可以的話,最好直接獲取Sitemap文件的網址。

+0

我不是這個網站的網頁設計師。我無法訪問網站本身。所以我不能嘗試生成一個XML映射。 我只是爲信息架構上的提案製作內容廣告資源,這使我從內容廣告資源入手。如果我手動這樣做,我永遠不會完成。所以我想知道是否有可用的軟件,搜索整個網站,並給我一個軟件所遵循的所有鏈接的報告(帶有一些良好的jeriarchy感)。比方說,我去微軟網站,我想要一個網站地圖,但在我的電腦,所以我可以看到他們有多少網頁。 – UXdesigner 2010-04-21 13:37:50

+1

有一些工具可以根據抓取生成網站的圖形地圖,但我沒有任何經驗,所以我不能推薦任何。對於較低級別的視圖,您可以使用Xenu的Link Sleuth甚至「wget」來抓取整個網站,然後根據URL對內容進行分類。然而,這些工具會發現網站上的所有內容(包括圖片,腳本等),因此您可能需要首先在較小的網站上嘗試它們,看看您是否可以使用它們的輸出。 – 2010-04-22 07:49:53