我有10個表,每個人有0.5 + M記錄(總計9M記錄)。每個表格中的結構非常相似。現在我想刪除每張表格內和表格之間的重複內容,或者說我想查看所有表格中存在的人員以及我實際擁有的唯一記錄數量。 但問題是數據量巨大。合併表(9M記錄)並刪除重複記錄
因此,我計劃創建不同的表格 - 1個用於電子郵件地址,1個用於移動號碼,1個用於地址等等。但是現在如果每張表都有5M記錄,那麼我的表格變得非常慢。
1解決方案是,我創建的表按照每月的出生日期,將導致12個表,然後我將能夠在每個表內排序數據。
請建議我該怎麼辦?數據是9.6M記錄/ 3.2GB
另外建議如何快速將數據從一個表格移動到另一個表格。
您正在處理的當前模式是什麼? – liquorvicar 2012-04-08 09:00:41
沒有模式,所有表都是不同時間的獨立記錄。每個記錄都有姓名,電子郵件,手機,dob等等。但是一個人可能會更改他的電子郵件,手機號碼不會;並且在某些情況下名稱可能會有點不同 – 2012-04-08 09:10:43