2011-01-19 49 views
1

我花了大量時間瀏覽網頁,無果而終,找不到解決方案。將可視站點地圖與We​​b應用程序鏈接起來

我有一個有很多頁面的web應用程序。許多頁面都有各自的子頁面,其中一些子頁面也有其他子頁面,等等。 Web應用程序就是UI,這意味着它是HTML模型。

我需要的是某種方式(顯然是在應用程序的幫助下)如何將具有所有這些HTML文件的文件夾與可視站點地圖連接起來。當我在這個文件夾中創建另一個HTML頁面時,我也需要這個網站地圖知道並修改這個頁面。也是一樣,如果一個頁面被刪除等...

我嘗試使用應用程序PowerMapper但因爲我的應用程序有很多,而不是錨,其連接到的DIV,跨度等JavaScript的鏈接,PowerMapper不承認這些作爲鏈接,因此當創建站點地圖時,會有很多斷開的鏈接,PowerMapper不允許您更改這些鏈接。它只是讀取網站/ Web應用程序,爬網則是創建可視站點地圖。

如果有人知道一個應用程序可以讓你將一個站點地圖連接到一個包含這些HTML模型的文件夾,反之亦然,並且你可以完全控制它,請讓我知道,因爲我完全迷失了。

非常感謝!

+0

將如何sitemapper瞭解JavaScript的鏈接?我的意思是,他們不是物理鏈接,因此他們不能被檢查。這裏有很多固有的問題:有很多方法可以鏈接事物並動態地改變JavaScript中的內容,其中許多變化實際上並不是新的網頁,您如何映射它?機器很難理解JavaScript鏈接背後的邏輯。這就是爲什麼我討厭JavaScript鏈接;) – kaoD 2011-01-26 14:33:07

+0

有道理。我使用的應用程序(PowerMapper)可以識別JavaScript鏈接,但前提是它們設置在頁面的某個位置。如果他們位於一個div並呼籲點擊,它不會識別它們,這是可以理解的。基本上,我需要這個系統,但我認爲這是不可能實現的:S – seedg 2011-01-26 16:14:56

回答

1

您可以使用Selenium編寫腳本來抓取鏈接。也許使用http://selenium.rubyforge.org/和一個簡單的ruby腳本。 Selenium可以感知JS,只需遍歷每個頁面的DOM並單擊每個節點即可。

您還可以使用的Watir和firewatir,http://watir.com/

0

根據我的經驗,顯示頁面間連接的站點地圖(如果鏈接到另一個頁面會導致無法讀取的蜘蛛網)......顯示頁面層次結構而不考慮它們之間的鏈接要好得多。作爲僞目錄結構。這裏有一個我已經放在一起的網站導航結構(在這種情況下存儲在數據庫中,但原則上可以隱含在網頁的目錄結構中)自動生成:http://www.ewb.ca/en/sitemap.html

這是您正在尋找的網站地圖類型?如果不是,你可以發佈你尋找的輸出類型的圖像嗎?

相關問題