2011-09-26 54 views
0

我想知道谷歌如何捕獲所有這些在谷歌的即時預覽功能的網站?我確定他們沒有使用縮略圖服務(如www.thumbalizr.com,websnapr.com,snapcasa.com,thumbshots.com),而是使用他們自己的軟件。但是:鑑於谷歌捕獲很多網站,他們必須有一個非常複雜的系統。 PLUS:這會產生大量的數據(jpgs?)。 有人更深入瞭解谷歌如何做到這一點?谷歌如何創建即時預覽圖像?

回答

0

這很難說,但這裏是從谷歌的項目經理的一些信息討論這個問題:

http://googleblog.blogspot.com/2010/11/beyond-instant-results-instant-previews.html

它說部分:

「我們您的查詢與索引匹配整個網絡,確定每個網頁的相關部分,將它們拼接在一起,並提供 產生的預覽完全自定義到您的搜索 - 通常在 十分之一秒「

那加尋找一個預覽頁面的源代碼表明,他們正在用自己的指數(用來服務於緩存頁面相同webcache.googleusercontent.com)擔任JPEG圖像Base64編碼字符串作爲截圖。

+0

只是爲了確保我正確理解你的意思:所以你認爲他們實際上是抓取網站的html代碼(再加上圖片),然後將其作爲jpeg推送給最終用戶? – memyself

1

是的,就是這樣的。他們的網站管理員頁面暗示他們使用Chrome使用的相同引擎渲染頁面,預覽基於結果。