4
我有一個大的列表(超過200,000)我想要比較給定的字符串的字符串。 給定的字符串是由用戶插入的,因此它可能稍微不正確。基於預先計算的哈希比較字符串距離
我希望做的是創建一些預先計算的哈希每個字符串添加到列表。這個哈希將包含諸如字符串長度,所有字符的添加等信息。
我的問題是,這樣的事情已經存在了嗎?肯定會有東西讓我避免在列表中的每個字符串上運行Levenshtein distance?
或者還有第三個選項我還沒有想過呢?