A BK Trees (Burkhard-Keller Trees)與模糊字符串搜索(例如拼寫檢查,單詞推薦)相關聯。所有的BK樹搜索算法都與explained here相同。目標是返回,例如"seek" and "peek" if I search for "aeek"。 現在,我的問題是,我想利用這個模糊字符串搜索算法來搜索從所有類似的項目給予詞典。例如,給一個詞「尋找」,我想找到全部類似的單
我正在清理一個我繼承的髒數據庫,並且需要對模糊匹配名稱進行人工審查。我提出了一個可行的解決方案,但速度非常慢 - 15k行7分鐘。我有這種感覺,我忽略了一些非常簡單的解決方案。 記錄示例: 1 John Smith
2 John Q Smith
3 Janway Smith
4 Jane Chen
5 David Jones
6 Natalia La Brody
7 Natalia L