最近,我遇到了一個博客,作者提到了關於集成Hbase和Hive的博客。這將是可能的嗎?如果是的話,兩者的優勢是什麼(在性能和可伸縮性方面)。如果我錯了,請糾正我。集成Hbase和Hive的優勢
2
A
回答
2
我認爲這將有可能,但不是微不足道的設置一點 - 也許CDH3最終將包括集成,當它出來。
優點:通過hbase進行Hive查詢。考慮加入並簡單地在HBase數據上進行彙總和簡單操作。
爲什麼不直接使用Hive而不打擾HBase? HBase爲您提供可擴展的存儲基礎架構,可保持數據在線。 StumbleUpon使用HBase作爲他們的直播網站。 Hive不是實時查詢引擎,因此其數據存儲不能用於類似目的。 Hive通過HBase爲您提供了兩個世界的好處。
0
目前有一個補丁可以在HBase和Hive之間加載數據。你可以在這裏找到它:
http://wiki.apache.org/hadoop/Hive/HBaseIntegration
實施開銷看起來是相當高的。
在HBase表上運行掃描並保存到外部文件然後將其導入到Hive中進行數據操作可能更容易。 (這也很麻煩,但如果你定期做它可以編寫腳本。)這是目前我正在處理的解決方案。我會讓你知道它是怎麼回事。至於你爲什麼選擇HBase而不是Hive,它們並不是真正可以互換的。 HBase意味着構建在Hadoop之上的高度可擴展的數據存儲,對數據分析的支持很少。另一方面,Hive不用於在生產環境中存儲數據,而是可以非常容易地在大量數據上運行特定查詢。
相關問題
- 1. HBase Hive集成 - 錯誤
- 2. hive/hbase集成上的MR scratch問題
- 3. Hive 0.14 - Hbase 0.98.8集成問題
- 4. 配置Hadoop,HBase和Hive集羣
- 5. Tomcat集羣的優勢和劣勢
- 6. 集成Hbase和PHP
- 7. Hadoop和HBase集成
- 8. 數據如何在Hive-HBase集成中的Hive和Hbase之間移動或反映。
- 9. hive和hbase中的數組
- 10. cloudera hbase和zookeeper集成
- 11. Hive HBase在發生故障時的集成行爲
- 12. ClassNotFoundException使用java客戶端的hive + hbase集成
- 13. Hive over HBase vs Hive over HDFS
- 14. Cassandra - Hive集成
- 15. Mahout Hive集成
- 16. Hive/HBase集成 - Zookeeper會話立即關閉
- 17. 失敗:元數據錯誤:MetaException(消息:org.apache.hadoop.hbase.MasterNotRunningException:在HBase + Hive集成
- 18. PySpark HBase/Phoenix集成
- 19. 哪些版本的HBase和Hive兼容?
- 20. 定義優勢的優勢
- 21. OpenTSDB與kerberized HBase的集成
- 22. Hive或HBase的報告?
- 23. Hive,Hbase和Hadoop 2.5.1兼容性
- 24. 比較玩家的優勢和劣勢
- 25. 優勢8.1和7.1
- 26. 優勢和在.net
- 27. XmlBlaster的優勢和弱點
- 28. ForkJoinWorkerThread的特性和優勢
- 29. Hbase 0.96與Mahout 0.9集成
- 30. 在Hive中註冊Hbase表