我經常需要檢查網頁上的某些字符串,這些字符串不一定拼寫完全相同。例如,有時我篩選頁面像谷歌一個字符串,然後在其他頁面上,我希望它來匹配,讓我們說:Gooogle企業或谷歌公司。模式匹配拼寫錯誤的字符串
從哪裏開始模式匹配和算法?
我經常需要檢查網頁上的某些字符串,這些字符串不一定拼寫完全相同。例如,有時我篩選頁面像谷歌一個字符串,然後在其他頁面上,我希望它來匹配,讓我們說:Gooogle企業或谷歌公司。模式匹配拼寫錯誤的字符串
從哪裏開始模式匹配和算法?
爲理論: 搜索編輯距離: https://en.wikipedia.org/wiki/Edit_distance
和n-gram中: https://en.wikipedia.org/wiki/N-gram
下面是一個實際的框架,其提供那些功能: fuzzyset.js
非常感謝,將查找那些 –
或一般來說,搜索「模糊搜索」 – Sepultura
https://開頭en.wikipedia.org/wiki/Levenshtein_distance –