可能重複:
How does the Google 「Did you mean?」 Algorithm work?谷歌的搜索如何知道你想說什麼?
任何人都知道落後於谷歌的搜索IDEIA時,它似乎知道你是什麼意思?
即:鍵入Michxael Gekson並發現邁克爾·傑克遜
可能重複:
How does the Google 「Did you mean?」 Algorithm work?谷歌的搜索如何知道你想說什麼?
任何人都知道落後於谷歌的搜索IDEIA時,它似乎知道你是什麼意思?
即:鍵入Michxael Gekson並發現邁克爾·傑克遜
當你有無限的資金,你可以花相當多的時間寫跟蹤算法,記錄一下用戶輸入並檢查他們的行爲的每一個細節。當用戶犯錯時,他們通常會糾正錯誤。連續第二次提交告訴谷歌用戶的意思,未來的用戶可以提供最終的安息之地結果。谷歌將採取所有用戶的相似性,並以最合理的方式編譯參考樹。
您是否正在自己的網站上尋找代碼?祝你好運。
您可以查看Levenshtein距離算法,看看您是否可以使用它來編譯自己的單詞和關係列表。
統計語言處理,根據實際數據進行調整。
一個簡單的示例是到達80%或90%的精度(以及有關解釋它是如何工作),可以發現:http://norvig.com/spell-correct.html
我不知道如果谷歌使用這些特定的數據結構,但一做這種「模糊匹配」的方法是用Burkhard-Keller Tree (BK-Tree)。