2015-02-05 56 views
-1

我是JavaScript和FireFox cfx SDK的新手。 我想寫一個FireFox的擴展,通過在它內部遞歸爬行來完整保存一個URL的內容。該程序可分爲以下幾個階段:遞歸保存網站

1- Saving contents of a given URL(including images, text, URLs and etc). 
2- Crawling pages(a.Extracting URLs inside the page, b. Recursively traversing them). 

我很感激,如果有人給我一些提示(如關鍵字研究或鏈接閱讀,這部分可以用CFX SDK來完成,哪一部分用JavaScript等)還有一件事要說,請求頁面應該用當前會話完成(就像用戶在標籤中打開URL一樣)[用戶可能已經登錄他的賬戶]

任何東西可能會有所幫助,謝謝提前:-)

+1

您是要求社區爲您設計擴展嗎?還是你在尋求資源?這不是很清楚。 – leDominatre 2015-02-05 23:45:32

+0

@DominatorX這是一個有效的問題,請看我爲什麼認爲這些倒票無效。回覆:Vast API – Noitidart 2015-02-06 00:53:36

+1

其實這些問題非常有效。我現在是一個6k的指針,我問了如何對窗口進行圖標化,而另一個用戶爲我勾畫了這個窗口。我用它作爲插件的起點。看到這裏的主題,看看解決方案如何提供我可以在我的插件中使用的頭腦風暴算法:http://stackoverflow.com/a/24030011/1828637 – Noitidart 2015-02-06 01:07:42

回答

1

這是一個有效的問題。由於XPCOM/HTML5 /其他API非常龐大,因此初學者需要幫助指出正確的方向。

這是我會怎麼做:

你可以的XMLHttpRequest(Sending Data to a Server using JavaScript(Firefox Addon))和獲取一個網頁的HTML。然後將頁面傳遞到像這樣的解析器:(How to parse a XML string in a Firefox addon using Add-on SDK),然後你可以去

var parser = new DOMParser(); 
var doc = parser.parseFromString(reponseFromAjax, "text/html"); 

var URLs = doc.getElementsByTagName('a'); 
var IMGs = doc.getElementsByTagName('img'); 

得到所有URL頁面上的。如果用戶沒有問過這個問題,我向你保證,我們將可能有另一種情況通過在AJAX返回文本上運行字符串操作而苦惱的開發人員。還有可能是正則表達式的返回文本。

要從cfx AddonSDK使用這些XPCOM,請參閱我鏈接的xmlhttprequest主題中的註釋。它說明如何導入鉻(Cu/Ci/etc)