有一個網站我想從Google緩存中檢索到數千頁。有什麼方法可以使用Google緩存或其他網絡抓取工具/存檔器快速恢復嗎?使用Google Cache檢索整個網站?
9
A
回答
5
你可以看到谷歌(仍然)使用site
知道一個網站限制:
http://www.google.com/search?q=site:[domain]
您還可以檢查出Internet Archive。
(在這兩種情況下,你可能想要做一些重型自動化獲取數千頁。)
10
我創建了一個free service to recover your website可以檢索從搜索引擎的緩存的網頁中。
該服務的輸出是一個帶有來自搜索引擎緩存的HTML的壓縮文件。它仍處於測試階段,因此它仍然需要很多調整和錯誤修正,但希望它可以幫助您或其他遇到同樣問題的人。
更新:我沒有時間繼續開發服務,因此它關閉。
+1
列出的網站是一個無效鏈接:( – NickG 2015-08-12 17:45:58
+1
如果你的github源代碼= O – dctremblay 2017-03-09 04:01:37
相關問題
- 1. 檢索網站
- 2. asp.net mvc cache在整個網站中刪除outputcache
- 3. 是否可以檢索Google的我的網站的完整索引?
- 4. 將Google+整合到網站
- 5. Python網站完整網站搜索
- 6. 使用Excel檢索網站xml
- 7. 使用disqus從網站檢索評論
- 8. 如何使用C#Google API翻譯整個網站?
- 9. Google在網站上搜索
- 10. asp.net User.IsInRole檢查整個網站
- 11. 檢查整個網站的鏈接
- 12. 使用本地主機上的Google API搜索整個網絡
- 13. 從網站檢索數據
- 14. 從網站檢索html
- 15. 使用Google API爲Google網站管理員添加網站
- 16. 有人如何從Google Cache下載網站?
- 17. 網站數據檢索
- 18. 檢查沒有索引幾個網站
- 19. 在整個網站上使用Silverlight?
- 20. 是outlook.com整個網站使用silverlight嗎?
- 21. 在整個網站上使用cookie
- 22. 使用asp.net 2.0創建整個網站
- 23. 在整個網站中使用會話
- 24. 從網站檢索數據
- 25. 當一個網站使用它的數據庫檢索
- 26. 將自定義Google地圖搜索整合到網站中
- 27. 如何使用Google自定義搜索API來檢查網站列表是否目前由Google編入索引?
- 28. 使用C#搜索多個網站
- 29. Google網站內容佔用了整個窗口
- 30. 使用GetElementsById搜索網站
我打算使用Warrick:http://warrick.cs.odu.edu/ 但是,唉,它的服務器太忙了。 Internet Archive在6個月後保存。 – stockoverflow 2010-08-08 17:20:37