我有大表(〜1,000,000行),可能包含重複的值。刪除大表中的重複行
該表包含兩列(例如col a,col b),它們共同表示唯一鍵,ID和最後更新日期。
例如我可以有如下表格:
id | a | b |更新
1 | jon |史密斯| 1/1
2 | don |史密斯| 2/5
3 | bob |大衛| 1/1
4 | dan |劉易斯| 3/1
5 | bob |大衛| 3/1
正如您可以看到id 3和5那樣,該表在a列和b列中都包含相同的值。 我想刪除包含這種重複的行,但保留最後一次更新的行。
對於這個例子,我將在刪除後有這張表: id | a | b |更新
1 | jon |史密斯| 1/1
2 | don |史密斯| 2/5
4 | dan |劉易斯| 3/1
5 | bob |戴維斯| 3/1
(ID = 3刪除,因爲我已經有一個擺錘=和b =戴維斯在行其中id = 5,該行中的更新是高於所述一個被刪除的行中)
一個自我引用應該是足夠的,因爲最新的更新的不平等就足以阻止行從與自身匹配起來。 – dasblinkenlight
你說得對,dasblinkenlight。在這樣的大型桌面上,性能增益會很大。榮譽。 ;) –