嘿,所有。我有一個有相當數量的行的MSSQL 2008數據庫。到目前爲止,在將新行插入表之前,存儲過程會檢查數據庫中是否已存在該記錄(通過檢查標題爲「標題」的列)。此檢查是確切的,如果要插入的記錄略有不同,它將插入它而不是更新現有的行(這是近似匹配)。我想要做的是在插入之前以某種方式檢測表中的近似重複。因此,要插入一個新的記錄是:使用T-SQL查找大約重複的數據庫記錄?
The quick brown fox jumps over the lazy dog
將大致匹配:
Quick brown fox jumps over the lazy dog
如果在表中存在這個記錄了。我見過(並用於其他情況)在T-SQL中實現的Levenshtein Distance算法,但我不確定這是否可以應用於我的情況,因爲需要一對輸入字符串來執行算法。社區成員如何處理這類事情?謝謝。