2009-12-02 74 views
0

首先,看起來這個問題不是程序相關的,但是我仍然決定在這裏發佈這個問題,因爲它有不透明的定義。如果您認爲這是錯誤的,請隨時刪除它。Google和其他搜索引擎如何確定關鍵字?

我很好奇Google和其他搜索引擎如何確定關鍵字?他們只是通過使用CTRL + F並計數,或者他們使用一些模糊的語義技術來選出關鍵字來找到關鍵字嗎?

我問這個問題的原因是當我檢查搜索引擎中的緩存頁面時,他們通常會以不同的顏色呈現關鍵字。像這樣的:

http://74.125.153.132/search?q=cache:YKq3QHbl0RwJ:www.autotrader.com/+car&cd=1&hl=en&ct=clnk&client=firefox-a

但似乎他們並不指望關鍵字在這個詞就像carpad。如您所知,CTRL + F cont 汽車carpad

所以我的問題是,如果我把公司的名字一樣carpad,或cardoctor在我的網站,是有利於汽車的關鍵字。

聲明:Car,carpad和我提供的URL僅僅是一些例子。我希望我明確自己。
在此先感謝!

回答

2

他們使用的一種基本技術是放置在該網站鏈接中的關鍵字文本。例如,當您鏈接到關於Obama's party crashers的文章時 - 請注意,鏈接文字是「奧巴馬派對不速之客」。 Google可以確定目標網站是關於該主題的。

接下來,它使用遞歸推理。如果我知道網站A和B是關於主題X的,並且它們都鏈接到網站C,我可以假設網站C也是關於主題X的。

接下來,它是對網站內容的實際文本挖掘。諸如TF/IDF之類的技術用於從給定頁面的內容中確定最相關的關鍵字。

0

有幾種技術的搜索引擎採用看到如果一個網頁是關於「汽車」:直接在頁面中提到

  1. 「汽車總動員」

  2. 外部鏈接有「車」錨文本

  3. 或者具有關鍵字語義接近「汽車」像「車」

  4. 他們也看看頁面的獨特特徵和唯一關鍵字的分佈。例如,如果搜索引擎知道許多關於「汽車」的頁面也有「保險」和「輪胎」,那麼他們可以猜測「保險」和「輪胎」所在的頁面可能與「汽車」有關那麼即使這個關鍵字不是直接存在的。有點像模式識別,你會發現大多數特徵匹配,你猜測整體應該匹配的概率很高。

和其他各種技術...

相關問題