我使用的是SQL Server 2008中的重複數據,我有一個用戶表:標識使用SSIS
Customer_ID int (PK)
First_name varchar
Last_name varchar
CIN varchar
address varchar
dateofbirth varchar
city varchar
我試圖找到重複的值。但是,我有不同名稱的客戶exp:Micheal winehouse,Michal winehouse,Micheal winouse,而他們實際上是同一個人。
我需要用SSIS標識重複的值。
到目前爲止,您已經嘗試過/寫過些什麼?我們需要您編寫的方法才能成爲偉大的方法。 –
你必須決定如何確定它是否是同一個人。既然你不能脫離這個名字,你將不得不決定哪一列將幫助你確定它是否是重複的。 – SQLChao
您需要決定「重複」是什麼意思。這可能是一個複雜的過程 - 匹配的姓氏和地址可能不是重複的;在你的例子中,如果一個叫邁克爾的人有一個叫米歇爾的妻子呢?一旦你決定了你的規則,你將需要選擇如何實現它們,但SSIS可能不是最好的答案;也許你可以使用SQL腳本,在Microsoft DQS上完成這項工作,在SSIS工作中......這是一個可以接受的解決方案嗎? –