要求:我有多個數據庫(Oracle/SQL Server)等。從數據庫中我需要將大量/大量數據導入到ac#程序中,並將數據與一個和別的。數據集中的每個數據文件都有一個密鑰(不是100%唯一的,也可能有重複的),使用該密鑰我可以比較其他數據集文件/數據庫。檢索並比較具有多列的超大型數據集
每個數據庫將返回約150萬行。我有5個不同的數據庫,我將從中獲取數據。即750萬行將被加載到我的程序中。
將數據加載到程序中的最佳方式是什麼(當前每個SQL在數據庫端需要5分鐘)。加載到CSV然後用C#讀取?任何其他想法?
我打算在c#中將數據加載到HashSet中,這是不錯的選擇嗎?
DB 1: Account Amount 1234 1 9999 66 DB 2: Account Amount 1234 2 9999 66 DB 3: Account Amount 1234 1 9999 66 DB 4: Account Amount 1234 10 9999 66 After comparing the output looks like Account DB1 Amt DB1 Amt DB3 Amt DB4 Amt Match? 1234 1 2 1 10 No 9999 66 66 66 66 Yes
如果它不是唯一的,那麼它不是一個關鍵。什麼是數據集中的數據文件? 2從哪裏來的DB1? – Paparazzi 2014-10-16 18:21:51
香膏,你是在說原始/第一篇文章中的決賽桌嗎?它的一個問題2屬於DB2。 – CoolArchTek 2014-10-16 18:40:09
個人來說,我會從數據庫中提取數據,然後導入到SQL Server中,然後編寫SQL進行比較(使用EXCEPT關鍵字很容易與MS SQL Server進行比較) – UnhandledExcepSean 2014-10-16 18:45:13