2011-05-13 75 views
0

這個問題有點類似this之一,但更具體。我想通過獲取兩個轉儲文件中差異的可視化來測試ETL過程。轉儲文件包含整個數據庫。這些差異不會在模式上進行,因爲這樣的比較很容易手動進行,而只是數據上的細微差別。用於比較轉儲文件中數據的任何工具?

有沒有工具可以做到這一點?我想象的可視化可能是這樣的:

Column1在10行中有0.02%的差異。

它當然也應該可以詳細查看每一行的實際差異。

是否存在這樣的工具。

回答

1

文本工具通常是您最好的選擇。

但是,如果我正在測試一個ETL過程,我不想一次測試整個轉儲。 (在我的情況下,這將是數百萬行。)我寧願自動將每個錶轉儲到一個單獨的文件。然後很容易判斷表格中兩個版本的數據是否相同。

cmp table.old table.new 

cmp如果文件相同,則不產生輸出。 diff會告訴你差異在哪裏。

diff table.old table.new 

我使用Cygwin當我必須在Windows下做這個東西。