0
我正在將SSIS解決方案轉換爲Hadoop以便在數據倉庫中進行ETL處理。從Hadoop端的關係數據庫中查找數據
我預期的系統:
ETL - 登陸&分期(Hadoop的)----把數據--->數據倉庫(MySQL的)
的問題是:在變換句話,我需要從hadoop端查找MySQL數據(豬或mapreduce作業)。有兩種解決方案:
1st:克隆所有表需要從MySQL查找到Hadoop。這意味着我們需要維護2個地方的數據。
2nd:直接查詢到MySQL。我擔心很多連接到MySQL服務器。
這個問題的解決方案/最佳實踐是什麼?還有其他解決方案嗎?