我想定期刮我的博客鏈接並存檔我鏈接到的頁面,以免他們永遠迷失在時間之沙。什麼是保存它們的最佳方式,以便當我稍後想要查看它們時,我可以看到它們是否會出現,如果我點擊鏈接時它們仍然存在?保存網頁
許多Web瀏覽器似乎都將此功能綁定到Ctrl/Cmd-S。有沒有一種很好的方式來編程?
我想定期刮我的博客鏈接並存檔我鏈接到的頁面,以免他們永遠迷失在時間之沙。什麼是保存它們的最佳方式,以便當我稍後想要查看它們時,我可以看到它們是否會出現,如果我點擊鏈接時它們仍然存在?保存網頁
許多Web瀏覽器似乎都將此功能綁定到Ctrl/Cmd-S。有沒有一種很好的方式來編程?
你不談論技術堆棧,所以也許什麼都行。
它在我看來像phantomjs可能是你要找的東西,它是一個無頭的webkit,所以可以刮你的網站,並把它寫成PDF。
http://code.google.com/p/phantomjs/wiki/QuickStart#Rendering
我還想保存視頻,js/css資源,圖片,互動元素等內容。我有點想要瀏覽器知道它是否加載了頁面的快照 - 所以在10年的時間裏,我可以回過頭來看看它是如何看到它的。 – nornagon 2012-02-23 04:43:28
http://www.archive.org/web/web.php – 2012-02-06 07:52:34