我有兩個數據庫,每個數據庫都有一個表,用於保存一些關於用戶的數據。他們不具有相同的數據,但他們確實有一些相同的字段。壞消息是這兩個表可能會引用相同的用戶,但他們的ID可能不匹配。這就是爲什麼我必須比較兩個表中的一些字段(例如名稱,姓氏,出生日期和電話號碼),並且如果所有字段匹配,我可以假設來自兩個表的記錄實際上描述了同一用戶。比較來自兩個數據庫的數據
我的問題是,在性能方面,比較兩個表中字段的最有效方法是什麼?我是不是應該對它們進行比較是這樣的:
t1.Name = t2.Name AND t1.Surname = t2.Surname AND t1.DOB = t2.DOB AND t1.Telephone = t2.Telephone
或者我應該計算這些字段的哈希值,然後比較哈希值?或者也許別的東西?
什麼正是你想知道的?是否有差異?哪些行?或哪些列?接下來要做的計劃是什麼?正確?合併? – 2013-07-24 17:03:05