2013-02-02 112 views
1

我正在構建數據倉庫(DW),我對加載數據有疑問;如果你們提供你的想法,我將不勝感激。分段設計策略

我打算先在臨時數據庫中一次加載所有的表,然後將數據從暫存數據庫加載到DW中。我想直接點擊OLTP系統(沒​​有分段),但我不能100%確定這是從性能角度來看最好的方法。

讓我舉一個例子:在我們的OLTP數據庫中,我們有一個叫做Customers的視圖,我將把它帶入DW中。 OLTP數據庫上的視圖非常複雜,select語句需要8分鐘。所以,如果我將這個表直接加載到DW中並執行增量加載,我認爲這會比首先將視圖加載到臨時表中需要更多的時間。此外,由於負載需要時間,DW的可用性也會受到影響,因爲用戶無法查詢數據。

你們有什麼建議?分期方法現在是否過時了?我想了解什麼是利弊。在此先感謝您的幫助

回答

1

我幫助維護數據倉庫,雖然我們不使用臨時數據庫,但我們使用臨時/工作/中間/ whatever_you_want_to_call_it表。

我們所要做的就是這樣。我們將原始數據作爲一系列分隔文件接收。然後,我們會對這些文件做我們認爲必要的任何操作來生成加載文件。然後,我們從加載文件填充我們的工作表,並做我們必須做的任何事情來進一步準備數據。然後我們從工作表中填充真實的表格。

在人們上班前,我們還會盡一切努力,儘量減少試圖在數據加載時查詢倉庫的人員的可能性。