使用--append和--incremental append將RDBMS中的新行插入HDFS中的現有數據集有什麼區別?我正在使用--append以及--where和--incremental append以及--last-value。sqoop中--append和--incremental append之間的區別
1
A
回答
3
--append
將數據添加到HDFS中
--append
--where "dpt_id >10"
現有數據集是一樣的:(ONLY追加數據到現有的數據集,還可以追加重複 - 注意:這不會覆蓋數據,但將追加):
--incremental append
--check-column dpt_id
--last-value 10
但不是下列選項(追加新數據並更新現有數據 - 沒有重複 - 注意:這不會覆蓋數據,但將更新或追加)
--incremental lastmodified
--check-column lastupdated
--last-value 20160802000000
Sqoop支持兩種類型的incremental
進口:append
和lastmodified
。
您可以使用--incremental
參數來指定要執行的增量導入的類型。
追加:
- 進口,其中會不斷添加隨着行ID值新行的表時,應指定
append
模式。 - 指定包含行ID的列爲
--check-column
。 - Sqoop導入行的檢查列的值大於
--last-value
指定的值。
上次更改時間:
- 的備用表更新通過Sqoop支持策略稱爲
lastmodified
模式。 當源表的行可能更新爲時,您應該使用它,每個這樣的更新都會將最後修改的列的值設置爲當前時間戳。 - 行中檢查列中保存的時間戳比導入的
--last-value
指定的時間戳更新。 - 運行後續導入時,應該用這種方式指定
--last-value
以確保只導入新數據或更新數據。 - 這是通過創建增量導入作爲保存作業自動處理的,這是執行循環增量導入的首選機制。
1
指定
--incremental lastmodified
將生成更新語句因此如果它取決於
--checkcolumn
提到的列中存在將更新該行雖然提
--incremental append
將插入重複的記錄,因爲它只會追加
相關問題
- 1. append(「svg:g」)和append(「g」)之間的區別
- 2. 創建畫板:.html()和.append()之間的區別?
- 3. 「FRAME FULL」和「FRAME APPEND」之間的Java字節碼區別
- 4. 插入和:append之間有什麼區別?
- 5. .empty()。append()和.html()之間有什麼區別?
- 6. sqoop和TDCH之間的區別
- 7. XMLDocument和JQuery之間的交互.append()
- 8. Angularjs jqlite append()和jquery append()與
- 9. 'append()'和沒有方括號的列表元素之間的區別
- 10. 差()和append()
- 11. jquery append img和
- 12. .append()和.empty()
- 13. .append問題。限制.append
- 14. JQuery中的.show()和.append()之間的衝突
- 15. java.io.writer的append和write方法有什麼區別?
- 16. append和addObject +有什麼區別+比較兩個日期
- 17. html js append和getElementByName
- 18. append()發生在hide()之前
- 19. JQuery append()
- 20. 從.append
- 21. jQuery .append()
- 22. 在append()
- 23. 的jQuery的append()和數據()
- 24. 的StringBuffer的append(「」)
- 25. Chosen JS with clone(true,true),append on append
- 26. jQuery的.append和鏈接
- 27. jQuery的.append和.prepend問題
- 28. Sqoop append命令如何在hadoop中工作
- 29. 的jQuery .append()
- 30. jquery .append()區分大小寫的元素