2011-06-21 52 views
0

我們正在從外部來源導入數據。這些數據沒有全局密鑰,所以我們有Varchars,日期等。沒有唯一密鑰的數據比較

問題是:如何使Varchar比較的性能更好?此外,它有任何工具,可以允許看到匹配百分比(像行的相似度:90%)

謝謝!

回答

2

雖然沒有直接回答你的問題,如果你要導入數據則集成服務(如果你是尚未使用它)將是一個不錯的選擇。 SSIS中包含的一些轉換允許「模糊匹配」 - 即基於相似度的置信水平匹配數據。

+0

請問我可以在哪裏找到如何開始使用SSIS的簡單步驟?這看起來很棒! – user194076

+0

創建一個簡單的ETL包:http://msdn.microsoft.com/en-us/library/ms169917.aspx - http://msdn.microsoft.com/en-us/library/ms167031.aspx –

+0

請參閱模糊查找轉換:http://msdn.microsoft.com/en-us/library/ms137786.aspx –

1

爲了找到「同類」匹配,你可以使用一個聽起來像比較:

WHERE SOUNDEX(some_column) = SOUNDEX(‘some_string’) 
+0

哇,從來沒有聽說過這個功能。謝謝! – user194076