2013-08-28 70 views
0

我注意到HIVE有很多依賴項,包括一個服務器url以及HBASE,通過bigtop集成測試進行掃描。爲什麼HIVE依賴於服務器URL和HBase?

參見:https://github.com/cloudera/bigtop/blob/master/test/src/smokes/hive/src/test/groovy/com/cloudera/itest/hivesmoke/TestJdbcDriver.java

在任何情況下,我不知道 - 原來它似乎是蜂巢基本上是到SQL聲明翻譯成MapReduce作業的方式。

hbase和「hive服務器」在Hive操作環境中的作用是什麼? Hive可以獨立成爲一個SQL - > MapReduce客戶端,還是這些困難的全局需求?

回答

3

從github代碼中,我們可以看到這是一個由cloudera組成的冒煙測試模塊,它需要使用JDBC來'連接'Hive。但實際上,我們確實可以在沒有「服務器」或「HBase」的情況下使用配置單元。

1)對於服務器URL,它是從遠程Java API連接到節點服務器的URL。這裏的服務器就像Hive世界的門面(你可以參考here或下面的圖片)。服務器需要由hive --service hiveserver &啓動。您可以跳過服務器並直接使用Hive CLI(嵌入模式),如here所述。 2)對於HBase,如果你不打算使用HBase,你可以不關心它。2)如果你不使用HBase,你可以不關心它。 Hive是一個數據倉庫工具,它可以處理位於HDFS,HBase等的數據。訪問HDFS很簡單,但訪問HBase有點複雜,使用"Hive-HBase-Integration"