2016-03-07 42 views

回答

2

是否要將數據作爲平面(或csv)文件移動到HDFS或將表格導入到HIVE DB之一。在HIVE導入的情況下,您可以使用Sqoop。 Sqoop用於將數據從RDBMS數據庫導入到HIVE DB。

+0

這兩種,從Oracle到HDFS的xml類型.....可以直接將xml類型存儲在HIVE中,sqoop支持那個.......我對HADOOP世界來說還是比較新的。 – raigeek

+0

您可以將xml數據存儲在HIVE列中,然後在其上使用XPATH。請參閱https://communities.intel.com/community/itpeernetwork/datastack/blog/2013/08/15/hadoop-tutorials-ingesting-xml-in-hive-using-xpath。有一件事你需要注意的是xml數據不應該有換行符 –