使用Google Cache檢索整個網站？

有一個網站我想從Google緩存中檢索到數千頁。有什麼方法可以使用Google緩存或其他網絡抓取工具/存檔器快速恢復嗎？使用Google Cache檢索整個網站？

你可以看到谷歌（仍然）使用site知道一個網站限制：

http://www.google.com/search?q=site:[domain]

您還可以檢查出Internet Archive。

（在這兩種情況下，你可能想要做一些重型自動化獲取數千頁。）

2010-08-07 03:45:28 user413588

我打算使用Warrick：http://warrick.cs.odu.edu/ 但是，唉，它的服務器太忙了。 Internet Archive在6個月後保存。 – stockoverflow 2010-08-08 17:20:37

我創建了一個free service to recover your website可以檢索從搜索引擎的緩存的網頁中。

該服務的輸出是一個帶有來自搜索引擎緩存的HTML的壓縮文件。它仍處於測試階段，因此它仍然需要很多調整和錯誤修正，但希望它可以幫助您或其他遇到同樣問題的人。

更新：我沒有時間繼續開發服務，因此它關閉。

來源

2012-01-05 14:34:27 Dofs

列出的網站是一個無效鏈接:( – NickG 2015-08-12 17:45:58

如果你的github源代碼= O – dctremblay 2017-03-09 04:01:37

回答