0
我必須將Hive表複製到另一個保持我的表的架構和層次結構的集羣,所以我的問題是:什麼是最安全和最恰當的方式來做到這一點,以便獲得確切的表(和數據庫)副本Cluster1插入Cluseter2。如何在羣集之間遷移數據?
我已經找到了其全球說:
- hive > export TABLE1;
- distcp hdfs:source_Path hdfs:dest_Path
- hive > import TABLE1; #in Cluster 2
- hive> MSCK REPAIR TABLE TABLE1;
但因爲我有複製的數據庫和表一無數的數量,有沒有什麼快捷和安全的方式,像重複Datawarehouse1的狀態或快照到Datawarehouse1 ...等?
在此先感謝。
將您的元數據複製到新羣集。我們使用mysql數據庫作爲配置單元Metastore。我們將元數據複製到新羣集,並使用distcp將整個倉庫文件夾(數據)複製到HDFS(即)/ apps/hive/warehouse – yoga