2013-10-14 61 views
2

我有相同的列和數據類型等2個蜂房表,我想將數據從一個表複製到另一個表中一個不同的簇。如何跨羣集將hive表複製到配置單元表?

並配置單元或sqoop提供一個簡單的方法來做到這一點?

場景:

Table A in Cluster1 
Table B in Cluster2 
Append table A into Table B on Cluster 2 

回答

0

一種便捷的方式來實現這一目標是使用蜂巢的Import/Export功能。 導出命令將表或分區的數據連同元數據一起導出到指定的輸出位置。然後可以將此輸出位置移至不同的Hadoop或Hive實例,並使用導入命令從那裏導入。

0

您可以使用獵鷹以及做數據複製。 您也可以使用配置單元上下文並在Java或Scala中編寫代碼來複制數據。

+1

你能展示一些示例代碼嗎? –

+0

在蜂房內的XML使像的變化: <結構> hive.metastore.uris 節儉:// hklpadhod08:9083,節儉:// hklpadhod09:9083

0

可以使用DistCp使用命令複製,你必須首先將表數據轉換成一個文件,並使用下面的command.Usage的文件複製到不同集羣之間clusters.But數據:

$ hadoop distcp (src) (dest) 

後該文件被複制到集羣2中,然後您可以在該表中加載該文件。 你可以在這個鏈接中找到更多信息:http://hadoop.apache.org/docs/r1.2.1/distcp.html

相關問題