我們正在研究創建於AWS數據湖的解決方案 - 類似於在這裏概述 - https://aws.amazon.com/blogs/big-data/introducing-the-data-lake-solution-on-aws/ETL VS ELT亞馬遜紅移
我們將存儲在S3中所有的「原始」數據,並將其加載到EMR或根據需要進行紅移。
在這個階段,我找對是否使用ETL或ELT方法將數據加載到亞馬遜紅移建議。我們將使用Talend進行ETL/ELT。
我們應該首先將其轉化還是應該在S3轉換數據並將其裝載到紅移前階段紅移「原始」從S3的數據?
我將不勝感激任何建議/建議。
謝謝。