2009-12-01 18 views
1

我想知道當前google的一大組頁面的緩存副本是多少。我想我需要瞭解谷歌最後一次抓取的時間如何

  1. 看在日誌IP的,
  2. 檢查,以發現用戶代理「Googlebot」,然後
  3. 出口,上面寫着每個頁面的列表,當它是上次訪問。

我想這可能是一個每週運行的cron作業。如果這是正確的,我將如何編寫腳本?如果這是錯誤的,那麼更好的方法是什麼?

回答

3

Google已通過Google SiteMaps提供此信息。我在過去三年中使用過它 - 效果很好。

將您的網站添加到SiteMaps,並將您網站上的SiteMap XML(Google提供免費的網站)放到您的Web服務器上,然後讓Google完成剩下的工作。 SiteMaps中有一個部分叫做Crawl Stats,可以給你想要的東西。

讓您的網站谷歌的觀點,並診斷問題

見谷歌如何抓取和索引你的網站 ,瞭解具體問題 我們在訪問它。

發現你的鏈接並查詢流量

查看,分類並下載有關內部和外部 鏈接到你的網站與新 鏈接報告工具 全面數據。找出哪些 Google搜索查詢會將您的網站的流量推向 ,並確切瞭解用戶 是如何到達那裏的。您的網站

分享信息,告訴我們您的網頁與 站點地圖:哪些是最 對你很重要,如何他們經常 變化。您還可以讓我們知道您希望 如何顯示我們索引到的網址 。

2

這不是必要的,您可以撥打穀歌服務電話查找緩存頁面,即搜索cache:stackoverflow.com,其中包括時間和日期。如果有一個API調用直接執行此操作(更新:Google Search API),我不會感到驚訝。

0

最後的Googlebot Access也可以通過mypagerank.net或Google Toolbar等網站免費找到。