我們正在從外部來源導入數據。這些數據沒有全局密鑰,所以我們有Varchars,日期等。沒有唯一密鑰的數據比較
問題是:如何使Varchar比較的性能更好?此外,它有任何工具,可以允許看到匹配百分比(像行的相似度:90%)
謝謝!
我們正在從外部來源導入數據。這些數據沒有全局密鑰,所以我們有Varchars,日期等。沒有唯一密鑰的數據比較
問題是:如何使Varchar比較的性能更好?此外,它有任何工具,可以允許看到匹配百分比(像行的相似度:90%)
謝謝!
雖然沒有直接回答你的問題,如果你要導入數據則集成服務(如果你是尚未使用它)將是一個不錯的選擇。 SSIS中包含的一些轉換允許「模糊匹配」 - 即基於相似度的置信水平匹配數據。
爲了找到「同類」匹配,你可以使用一個聽起來像比較:
WHERE SOUNDEX(some_column) = SOUNDEX(‘some_string’)
哇,從來沒有聽說過這個功能。謝謝! – user194076
請問我可以在哪裏找到如何開始使用SSIS的簡單步驟?這看起來很棒! – user194076
創建一個簡單的ETL包:http://msdn.microsoft.com/en-us/library/ms169917.aspx - http://msdn.microsoft.com/en-us/library/ms167031.aspx –
請參閱模糊查找轉換:http://msdn.microsoft.com/en-us/library/ms137786.aspx –