2017-05-04 85 views
0

我們有一列大數據量,我們需要使用Python識別重複/可能的重複。識別單個列重複的記錄,體積較大,同一列使用python

拉斯維加斯大道,大道小號

3745拉斯維加斯大道小號

3745拉斯維加斯大道南,拉斯維加斯大道


的Raintree Polo Towers酒店拉斯維加斯 - 拉斯維加斯

Polo Towers By Raintree


波羅大廈由鑽石度假村

鑽石度假村Polo Towers酒店 - 拉斯維加斯

我需要確定我的數據庫實例像上面。可以在此任意一個幫助,蟒蛇,在此先感謝。

回答

0

那麼你可能分裂由字符串「」和夾板起來後輸出的每一個元素,這樣的搜索表:

SELECT @variable = top(1), columnname from yourtable 

SELECT * from youtable WHERE Split(@variable) LIKE '%"+columname+"%' 
  1. 您用逗號或其他任何需要拆分功能分隔符
  2. 你必須遍歷從yourtable每個元素,在我的例子中,我只用了第一個(TOP(1))
+0

感謝您的回覆,但尋找更有效的IM,因爲我有大量的數據量。 –