2011-04-11 15 views
9

如何以編程方式保存網頁快照及其所有元素(css,js,images, ...)成一個文件?如何將網頁快照及其所有元素(css,js,images,...)保存到一個文件中

我需要定期存檔一些網頁。但是,只保存HTML代碼是無用的 - 不僅僅是因爲圖像丟失,而且還有esp。因爲今天的頁面上沒有CSS可以將網頁變成無法識別的混亂。

我記得這樣工作的.mht格式,但這需要手動保存,而這只是IE的一個功能。我相信有一個開源解決方案可以以編程方式實現這一目標,但是儘管經過數小時的搜索,我仍無法在網上找到它。

回答

10
+1

它不下載JavaScript – nest 2015-01-20 15:57:58

+0

沒有任何值得下載的JavaScript,您不會直接加載(因此直接保存)。這就是說:你可以做一個普通的httrack,沒有 - %M,然後把它放到一個檔案中。有了像archivemount這樣的東西,即使你不需要,你也可以無縫地打開它們。所有輕鬆腳本。堆棧溢出很糟糕。 – reisio 2017-08-27 01:17:59

0

我覺得@reisio(+1)有你覆蓋...

...但如果只插入一個偉大的自由工具,我想指出的Firefox擴展Save Complete ,它在特設基礎上抓取「完整」頁面的工作非常出色。輸出將是一個單獨的HTML文件,其伴隨的目錄中塞滿了所有的資源 - 您可以輕鬆地壓縮它們進行歸檔。

這不是沒有錯 - 我最近在OSX上遇到了損壞的.png文件問題,但我經常使用它從實況頁面構建模型,這是一個巨大的節省時間。 (也請注意,它尚未更新爲FF 4,並且是我回滾到3.6的唯一原因)

+0

這種方法如何自動化,甚至是可編程的? – Christian 2011-04-11 22:10:20

+0

它比自動收集所有資源和遷移引用等更自動化。請參閱此警告:「在_ad hoc_client」基礎上?我並不是說它是完美的解決方案,但可能對嘗試實現類似的半自動化結果的人有用。另外,爲了辯論的緣故,你可以編寫腳本來進一步自動化:http://macscripter.net/viewtopic.php?id=21304。 (你認爲所有可能有用的,但不完美的解決方案應該是-1'ed?我抵抗投降你自己的不完美但可能有用的答案的衝動。精神犯規。) – peteorpeter 2011-04-11 23:18:36

+0

半完美?它可以工作,它不依賴於瀏覽器,而且比嘗試腳本化Firefox更自動化!我們是否又回到了「僅通過Firefox瀏覽」時代,或者是什麼?我的解決方案可以在任何平臺上用任何語言完成。你的解決方案似乎只適用於Mac上的Firefox。另外,爲了做一些文本操作而發射瀏覽器聽起來過於工程化。 – Christian 2011-04-12 07:34:10

0

如果您使用的是Google Chrome,只需使用保存頁面作爲菜單項(CTRL + s) ,並從文件對話框底部的選項中選擇完整的網站。這將保存HTML和所有必需資源(在單獨的文件夾中)。

+3

我們尋找一種方法來做到這一點_programmatically_。 – Vacilando 2011-11-16 17:48:37

相關問題