3
Here是查詢快照what is benzene
。谷歌如何給出頁面摘要
Google通常會提供位於響應查詢的文檔或網站摘要。 用戶瀏覽此類摘要,通常會選擇與搜索結果最匹配的摘要關聯的鏈接。
我想知道Google如何給出最精確的任何網頁摘要。 我試圖通過選擇任何查詢的關鍵字(snippets)
,並使用Cosine Similarity
來計算片段與網頁中每個單句之間的距離,並選擇具有最高分數但結果不令人滿意的句子。我想知道有沒有更好的算法或生成Web文檔摘要的其他方法?
你不可能從Google獲得任何人告訴你他們的算法。 –
是什麼讓Google搜索在構建片段方面如此高效,它是它在自己的頁面(搜索結果,YouTube,谷歌+)和包含adwords塊的頁面上收集的統計信息的集合。它收集一切:點擊鏈接,滾動,甚至鼠標懸停。 –
@DavidWallace很顯然,谷歌不會透露算法,但會有一個通用技術或任何NLP分類器生成夏季,這正是我想要得到的。 –