我正在研究數據倉庫,我試圖弄清楚如何最好地驗證數據清理(規範化)數據庫中的數據是否正確地進入我們的數據集市。我已經完成了一些搜索,但迄今爲止的結果更多地討論了確保約束已到位等問題,並且您需要在ETL過程中進行數據驗證(例如日期有效等)。這些維度非常簡單,因爲我可以輕鬆地利用主鍵或編寫一個非常簡單且可驗證的查詢來獲取數據。事實表更復雜。如何驗證數據集市中的正確數據?
有什麼想法?我們試圖使主題導出非常簡單,以便運行幾個查詢,查看來自數據清理數據庫和數據集市的一些數據,並在視覺上比較兩者以確保它們是正確的。
感謝您的信息。因爲我昨天找不到任何東西,所以我開始做類似的工作,在數據集市中查看大量數據,並將這些數據塊與我們清理數據庫中的特定記錄進行比較。但是,我確實喜歡做兩次計算的想法。我們只是不希望我們的驗證看起來像我們的ETL過程。 – blockcipher 2010-03-11 13:32:52