我有一個要求,使Hive中的數據倉庫和使用HBase服務實時訪問 所以我想知道什麼是相同的架構 我可以首先轉儲數據在HBase和訪問它作爲Rest服務並在Hive中創建外部表,並在其上運行配置單元查詢? 威爾蜂巢分佈即我需要我的集羣中的所有節點上安裝蜂巢否則這將是中央Hive中的數據倉庫
回答
在回答你的問題:
蜂巢將分發。
爲了獲得最佳性能,我會考慮在羣集的每個節點上安裝Hive。 Hive將HiveQL轉換爲MapReduce作業 - 作業將在數據所在的位置執行。如果這是不可能的,數據將不得不轉移到工作中。爲了響應時間,您需要在每個節點上配置Hive。
要創建引用存儲在HBase中的數據的Hive表,可以查看Hive - HBase Integration wiki。這裏有一個簡單的例子:
CREATE TABLE hbase_table_1(key int, value string)
STORED BY 'org.apache.hadoop.hive.hbase.HBaseStorageHandler'
WITH SERDEPROPERTIES ("hbase.columns.mapping" = ":key,cf1:val")
TBLPROPERTIES ("hbase.table.name" = "xyz");
感謝Jeremiah爲您提供的輸入信息 –
因此,我可以使用HBase進行近實時查詢嗎?並進行數據轉換hive查詢將在HBase表上運行 –
你明白了!只要您以易於使用HBase讀取的方式構建數據,您應該可以使用HBase進行實時訪問,並使用Hive進行批量處理和轉換。請記住,Hive只是'INSERT' /'DELETE' - 沒有更新。 –
- 1. Sqoop導入到/ user/hive /倉庫中的hive數據庫中
- 2. 設置Hadoop數據倉庫環境(Hive)
- 3. Hive未能在倉庫中顯示錶
- 4. Hadoop&Hive作爲倉庫:每日數據交付
- 5. 免費數據倉庫 - Infobright,Hadoop/Hive還是什麼?
- 6. Hadoop Hive數據庫
- 7. SQL數據倉庫
- 8. 數據倉庫 - OLTP
- 9. Pyspark:遠程Hive倉庫位置
- 10. Hive:即使當表是外部時,源數據也被移動到hive數據倉庫
- 11. 如何將數據庫A的Hive表中的數據加載到數據庫B的Hive表中?
- 12. 數據倉庫中的重疊記錄
- 13. 數據倉庫中的索引
- 14. 數據倉庫中的分段步驟?
- 15. 數據倉庫中的代理鍵
- 16. 數據倉庫中的時間差異
- 17. 處理數據倉庫中的空值
- 18. SQL Server 2008中的數據倉庫
- 19. azure中SQL數據倉庫的價格
- 20. 數據倉庫中的列存儲
- 21. Webfocus數據倉庫中的報告
- 22. 基於Hive的數據倉庫任務 - 添加序列號到記錄
- 23. 使用Hive作爲數據倉庫時對我的情況有什麼好處?
- 24. Azure數據倉庫中的用戶主數據庫
- 25. 數據庫/數據倉庫中的多重衝突事實
- 26. Spring數據庫JPA在兩個數據庫倉庫中使用
- 27. 數據倉庫 - OLAP操作
- 28. 創建數據倉庫
- 29. Cassandra用於數據倉庫
- 30. 什麼是數據倉庫?
請告訴我們你到目前爲止做了些什麼。 –