2014-04-05 76 views
3

Here是查詢快照what is benzene谷歌如何給出頁面摘要

Google通常會提供位於響應查詢的文檔或網站摘要。 用戶瀏覽此類摘要,通常會選擇與搜索結果最匹配的摘要關聯的鏈接。

我想知道Google如何給出最精確的任何網頁摘要。 我試圖通過選擇任何查詢的關鍵字(snippets),並使用Cosine Similarity來計算片段與網頁中每個單句之間的距離,並選擇具有最高分數但結果不令人滿意的句子。我想知道有沒有更好的算法或生成Web文檔摘要的其他方法?

+0

你不可能從Google獲得任何人告訴你他們的算法。 –

+1

是什麼讓Google搜索在構建片段方面如此高效,它是它在自己的頁面(搜索結果,YouTube,谷歌+)和包含adwords塊的頁面上收集的統計信息的集合。它收集一切:點擊鏈接,滾動,甚至鼠標懸停。 –

+0

@DavidWallace很顯然,谷歌不會透露算法,但會有一個通用技術或任何NLP分類器生成夏季,這正是我想要得到的。 –

回答

2

你可以用來給出一個總結是使用w元描述標籤。谷歌也在使用它,除非機器人決定他可以生成更準確的描述,更精確的描述更適合您的搜索查詢。例如除非你正在編寫一些其他類型的網頁相比文檔的搜索從您發佈的圖像彙總的一個是直接從描述

<meta name="description" content="Benzene is a colorless, flammable liquid with a sweet odor. Learn what we know about benzene and cancer risk." /> 

。瀏覽器做了很多文檔,他們只是給你一個句子(或之前/之後的幾個詞)匹配關鍵字。

相關問題