0
我在一個表中Oracle中有大量數據,一種列類型是包含主數據的XML類型。我需要將這些數據移至HDFS。在Hadoop HDFC中遷移此數據的最佳方式是什麼?任何示例代碼或說明將不勝感激。如何將XML類型的oracle數據遷移到Hadoop HDFS
我在一個表中Oracle中有大量數據,一種列類型是包含主數據的XML類型。我需要將這些數據移至HDFS。在Hadoop HDFC中遷移此數據的最佳方式是什麼?任何示例代碼或說明將不勝感激。如何將XML類型的oracle數據遷移到Hadoop HDFS
是否要將數據作爲平面(或csv)文件移動到HDFS或將表格導入到HIVE DB之一。在HIVE導入的情況下,您可以使用Sqoop。 Sqoop用於將數據從RDBMS數據庫導入到HIVE DB。
這兩種,從Oracle到HDFS的xml類型.....可以直接將xml類型存儲在HIVE中,sqoop支持那個.......我對HADOOP世界來說還是比較新的。 – raigeek
您可以將xml數據存儲在HIVE列中,然後在其上使用XPATH。請參閱https://communities.intel.com/community/itpeernetwork/datastack/blog/2013/08/15/hadoop-tutorials-ingesting-xml-in-hive-using-xpath。有一件事你需要注意的是xml數據不應該有換行符 –