-1
我最近在Hive和HBase之間進行了整合。我使用HBase serde創建了一個配置單元表,當我將記錄插入配置單元表時,它將被裝載到HBase表中。我想了解如果插入到HiveHBase表中失敗怎麼辦? (HBase服務失敗/網絡問題)。我假設已經加載到HBase的記錄將在那裏,當我重新運行操作時,我將有兩個不同時間戳的數據副本(假設在20K記錄中插入了10k並且發生故障)。Hive HBase在發生故障時的集成行爲
- 將記錄插入HBase的最佳方式是什麼?
- Can Hive能否提供安全檢查以查看數據是否已經存在?
- mapreduce是這樣的場景的最佳拍攝嗎?我將編寫一個mapreduce程序,用於從配置單元讀取數據,並在插入之前通過hbase中的記錄檢查記錄。這確保沒有重複寫入
任何幫助,將不勝感激。