我試圖找到一種方法來搜索文本字段以識別可能類似的行,以便我可以確定它們是否應該合併重複。例如,如果數據我看起來像這樣:Oracle查找類似但不完全匹配的重複記錄
MyText_Column
-
鮑勃
- 鮑比
- 羅伯特
- 簡
- 詹尼
- 珍妮 喬
- 約翰
- 喬納森
一個GROUP BY將無法工作,因爲沒有值是完全一樣的,但如果我能有一個查詢,將返回的可能性的列表,一排類似會很好。也許有一個更好的佈局,但我所想象的是這樣一個結果:
查詢結果
搜索比較Likely_Match
- 鮑勃·鮑比96%
- 鮑勃·羅伯特12%
- Bob Jane 0%
- Bob Janey 0%
- ... ..
- 簡詹尼87%
- 簡珍妮69%
- 簡喬12%
然後用類似的結果,我可以由似然和目視掃描排序,以確定該結果是重複或不。