有沒有辦法使用sqoop做增量導出?我正在爲sqoop使用Hcatalog集成。我嘗試使用--last-value,--check-column選項用於增量導入,但sqoop給了我錯誤的選項無效。使用hcatalog的Sqoop增量導出?
0
A
回答
1
中所述我還沒有看到增量sqoop導出參數。您可以嘗試的另一種方法是在配置單元中創建一個contol_table,您可以在每次最後一次導出時保留表名&時間戳記的日誌。
create table if not exists control_table (
table_name string,
export_date timestamp
);
insert into control_table 'export_table1' as table_name, from_unixtime(unix_timestamp()) as export_date from control_table;
如果export_table1是要逐步,如果以上兩個語句已經執行假設導出表。
--execute below at once
--get the timestamp when the table was last executed
create temporary table control_table_now as select table_name, max(export_date) as last_export_date from control_table group by table_name;
--get incremental rows
create table new_export_table1 as select field1, field2, field3, .... timestamp1 from export_table1 e, control_table_now c where c.table_name = 'export_table1' and e.timestamp1 >= c.last_export_date;
--append the control_table for next process
insert into control_table 'export_table1' as table_name, from_unixtime(unix_timestamp()) as export_date from control_table;
現在,導出使用sqoop export命令增量創建的new_export_table1表。
0
默認情況下sqoop不支持hcatalog整合增量更新,當我們嘗試它給了以下錯誤
追加方式進口不符合HCatalog兼容。請刪除參數 - 追加模式 在org.apache.sqoop.tool.BaseSqoopTool.validateHCatalogOptions(BaseSqoopTool.java:1561)
您可以使用查詢選項,使其工作。如this hortonworks document
相關問題
- 1. 的Apache Sqoop增量導入
- 2. Sqoop增量導入和CURRENT_TIMESTAMP
- 3. Sqoop增量導入失敗
- 4. 保存sqoop增量導入id
- 5. 使用自由格式查詢的Sqoop作業增量導入
- 6. 如何使用Sqoop從MySQL到Hive的增量導入?
- 7. 使用Sqoop增量導入作爲塊明智
- 8. Sqoop合併 - 使用增量導入更新記錄
- 9. Sqoop進口HCatalog /蜂巢 - 表不可見
- 10. Sqoop導出列
- 11. 使用查詢的Sqoop導出
- 12. 在sqoop中增量更新
- 13. 增量sqoop與條件
- 14. 上次修改的Sqoop增量類型不會執行增量導入
- 15. 使用Sqoop導出到Postgresql ltree
- 16. Sqoop導出錯誤
- 17. sqoop導出失敗
- 18. Sqoop增量導入和更新不起作用
- 19. Sqoop導入/導出問題
- 20. 如何使用增量導入 - 存儲在sqoop Metastore中的--last-value
- 21. 我們如何自動化SQOOP中的增量導入?
- 22. Sqoop增量導入到S3錯誤的FS錯誤
- 23. Sqoop增量作業導入更多的記錄數比源
- 24. 使用sqoop從RDBMS向配置單元/ hadoop增量導入數據
- 25. 不支持使用sqoop增量導入到配置單元表嗎?
- 26. 如何在python代碼中使用sqoop命令進行增量導入
- 27. sqoop導入大量NULL行
- 28. sqoop導出性能問題
- 29. SQOOP導出 - 問題與UPSERT
- 30. Sqoop導出分區Hive表
sqoop是否適用於更新導出中的行?從new_export_table1,如果我運行sqoop,它會更新舊的行嗎? – VoodooChild
@VoodooChild是的,如果你的Hive表中的export_table1有一個唯一的字段並且同一個字段是結束表中的主鍵,那麼** sqoop **應該更新相應的字段。請參閱https://sqoop.apache.org/docs/1.4.2/SqoopUserGuide.html#_inserts_vs_updates – gkc123