2014-01-08 67 views
2

我試圖將數據追加到已存在的hive表中。先使用以下命令將表從MS-SQL Server導入配置單元。使用Sqoop將數據添加到配置單元表

Sqoop命令:
sqoop import --connect "jdbc:sqlserver://XXX.XX.XX.XX;databaseName=mydatabase" --table "my_table" --where "Batch_Id > 100" --username myuser --password mypassword --hive-import

現在我想將數據以相同的現有表追加在蜂房其中 「BATCH_ID < 100」 我使用下面的命令:

sqoop import --connect "jdbc:sqlserver://XXX.XX.XX.XX;databaseName=mydatabase" --table "my_table" --where "Batch_Id < 100" --username myuser --password mypassword --append --hive-table my_table

但是,此命令成功運行也會更新HDFS數據,但是當您連接到配置單元外殼並查詢該表時,附加的記錄不可見。 Sqoop更新了hdfs 「/ user/hduser/my_table」上的數據,但「」/ user/hive/warehouse/batch_dim「上的數據未更新。

如何解決此問題。

問候, Bhagwant Bhobe

回答

1

使用

sqoop import --connect "jdbc:sqlserver://XXX.XX.XX.XX;databaseName=mydatabase" 
       --table "my_table" --where "Batch_Id < 100" 
       --username myuser --password mypassword 
       --hive-import --hive-table my_table 

當您使用--hive-import切勿使用--append參數嘗試。

相關問題