2012-08-28 55 views
0

我正在嘗試編寫一段代碼,它將比較兩個varchar列,其中每個匹配的字符數量都被加權並分配一個值,然後我可以稍後使用該值來確定是否他們是否是「模糊」匹配。到目前爲止,我有一個可以去除數字和空格的函數,我認爲我可以用它作爲起點。有沒有人有任何方向,他們可以推動我或一些建議? 謝謝 布賴恩比較兩個varchar字段的相似性

回答

1

您可能會看看SOUNDEX功能。

1

這取決於數據類型。 Soundex,Metaphone,Double Metaphone都適用於人名。但不適合比較街道地址,例如editdistance(Levenshtein距離)可能用於模糊匹配街道地址。

Jaro-Winkler距離和Q-gram是我想到的用於模糊匹配的其他技術。

這裏是一個editdistance的實現。如果你想知道它是什麼。

http://www.sqlteam.com/forums/topic.asp?TOPIC_ID=51540&whichpage=2

+0

謝謝大家的回覆! Soundex看起來會幫助我實現我的目標。如果我遇到任何問題,我會告訴你。 –