0
我在將MySql轉儲導入到Hive時遇到問題。從MySql轉儲導入到配置單元
我使用sqoop
連接器成功將數據從MySql
導入Hive
。但是,還有更多數據轉儲需要導入到Hive。首先恢復數據庫是不可行的。由於轉儲大小爲300G,因此需要3天才能恢復。另外,由於磁盤空間問題,我無法在MySql上還原兩個以上的文件。
因此,我正在尋找將MySql轉儲中的數據直接導入到配置單元中,而無需還原到MySql中。
還有一個問題,MySql轉儲是有多個插入語句(大約10億)。那麼它會爲每個插入創建多個文件?在那種情況下,如何合併它們?
提供更多詳細信息,如 – Phoenix
中的數據格式我有一個mysql數據轉儲,我想直接導入到配置單元(HDFS底層它),而無需將其恢復到MySql。 –