2012-02-06 86 views
1

我想定期刮我的博客鏈接並存檔我鏈接到的頁面,以免他們永遠迷失在時間之沙。什麼是保存它們的最佳方式,以便當我稍後想要查看它們時,我可以看到它們是否會出現,如果我點擊鏈接時它們仍然存在?保存網頁

許多Web瀏覽器似乎都將此功能綁定到Ctrl/Cmd-S。有沒有一種很好的方式來編程?

+0

http://www.archive.org/web/web.php – 2012-02-06 07:52:34

回答

0

我想你可以嘗試ifttt

做一個任務,讓IFTTT定期刮你的文章(也許RSS),然後做一些事來保存它。您可以選擇發送有關內容的電子郵件,或將其發送至Evernote。我正在使用第二種方法。

+0

我想保存儘可能接近原貌成爲可能,包括圖片,JavaScript和CSS文件等的頁面。有很多鏈接的文檔可以從主HTML中分別加載。 – nornagon 2012-02-06 08:00:18

1

你不談論技術堆棧,所以也許什麼都行。

它在我看來像phantomjs可能是你要找的東西,它是一個無頭的webkit,所以可以刮你的網站,並把它寫成PDF。

http://code.google.com/p/phantomjs/wiki/QuickStart#Rendering

+0

我還想保存視頻,js/css資源,圖片,互動元素等內容。我有點想要瀏覽器知道它是否加載了頁面的快照 - 所以在10年的時間裏,我可以回過頭來看看它是如何看到它的。 – nornagon 2012-02-23 04:43:28