2016-05-11 25 views
0

我必須準備一張表格,我將保留一些彙總數據的每週結果。表格將有30個字段(10個字符,20個十進制),我想我每週將有25萬行。設置表格與多表設置的表現

在我的頭上,我可以看到兩種情況:

  1. 設置表,並在防止重複行依靠Teradata的 - 它應該跳過重複的條目,而插入新的數據
  2. 與UPI
  3. 多集表 - 它會在插入重複行時發生錯誤。

INSERT語句將通過Excel上的VBA執行,其中處理可能的teradata錯誤不是問題。

哪種情況下,將以更快的速度在一年時間運行哪裏還會有大約14個百萬行

是否有已經完成它的任何其他方式?

問候

+0

您是否只希望在特定的關鍵字列中保留表格中的唯一記錄@kwasny –

回答

0

在一個較高的水平,因爲你會爲你的桌子上一個比較高的數據計數,最好不要使用一套表格,與多集表,而走。 對於您可以參考此鏈接

http://www.dwhpro.com/teradata-multiset-tables/ 
+0

非常感謝您提供此鏈接 - 在此發佈的信息非常好地解釋了兩種方法 – kwasny

+0

np ..的優缺點.. :) @kwasny –

0

爲什麼你關心重複的行更多信息?當你存儲每週聚合時,應該沒有重複。重複行與重複的主鍵值不同。

只需選擇最適合您的加入/訪問模式的PI(可能按日期分區)。爲了避免任何潛在的重複,你可以簡單地使用MERGE而不是INSERT。

+0

加載數據時我不應該有重複的行 - 我試圖找出解決方案,如果有人會嘗試再次加載數據。這促使我依靠加載應用程序不加載相同的數據兩次,這很好。我不應該允許重複行,但如果需要「計數器」或「糾正」事務,我應該允許重複主鍵值 - 非常感謝您將此指向我。 – kwasny