遞歸保存網站

-1

我是JavaScript和FireFox cfx SDK的新手。我想寫一個FireFox的擴展，通過在它內部遞歸爬行來完整保存一個URL的內容。該程序可分爲以下幾個階段：遞歸保存網站

1- Saving contents of a given URL(including images, text, URLs and etc). 
2- Crawling pages(a.Extracting URLs inside the page, b. Recursively traversing them).

我很感激，如果有人給我一些提示（如關鍵字研究或鏈接閱讀，這部分可以用CFX SDK來完成，哪一部分用JavaScript等）還有一件事要說，請求頁面應該用當前會話完成（就像用戶在標籤中打開URL一樣）[用戶可能已經登錄他的賬戶]

任何東西可能會有所幫助，謝謝提前:-)

來源

2015-02-05 Ahmad Siavosh

您是要求社區爲您設計擴展嗎？還是你在尋求資源？這不是很清楚。 – leDominatre 2015-02-05 23:45:32

@DominatorX這是一個有效的問題，請看我爲什麼認爲這些倒票無效。回覆：Vast API – Noitidart 2015-02-06 00:53:36

其實這些問題非常有效。我現在是一個6k的指針，我問了如何對窗口進行圖標化，而另一個用戶爲我勾畫了這個窗口。我用它作爲插件的起點。看到這裏的主題，看看解決方案如何提供我可以在我的插件中使用的頭腦風暴算法：http://stackoverflow.com/a/24030011/1828637 – Noitidart 2015-02-06 01:07:42

這是一個有效的問題。由於XPCOM/HTML5 /其他API非常龐大，因此初學者需要幫助指出正確的方向。

這是我會怎麼做：

你可以的XMLHttpRequest（Sending Data to a Server using JavaScript(Firefox Addon)）和獲取一個網頁的HTML。然後將頁面傳遞到像這樣的解析器：（How to parse a XML string in a Firefox addon using Add-on SDK），然後你可以去

var parser = new DOMParser(); 
var doc = parser.parseFromString(reponseFromAjax, "text/html"); 

var URLs = doc.getElementsByTagName('a'); 
var IMGs = doc.getElementsByTagName('img');

得到所有URL頁面上的。如果用戶沒有問過這個問題，我向你保證，我們將可能有另一種情況通過在AJAX返回文本上運行字符串操作而苦惱的開發人員。還有可能是正則表達式的返回文本。

要從cfx AddonSDK使用這些XPCOM，請參閱我鏈接的xmlhttprequest主題中的註釋。它說明如何導入鉻（Cu/Ci/etc）

來源

2015-02-06 00:53:00 Noitidart

遞歸保存網站

回答

相關問題