我注意到HIVE有很多依賴項,包括一個服務器url以及HBASE,通過bigtop集成測試進行掃描。爲什麼HIVE依賴於服務器URL和HBase?
在任何情況下,我不知道 - 原來它似乎是蜂巢基本上是到SQL聲明翻譯成MapReduce作業的方式。
hbase和「hive服務器」在Hive操作環境中的作用是什麼? Hive可以獨立成爲一個SQL - > MapReduce客戶端,還是這些困難的全局需求?
我注意到HIVE有很多依賴項,包括一個服務器url以及HBASE,通過bigtop集成測試進行掃描。爲什麼HIVE依賴於服務器URL和HBase?
在任何情況下,我不知道 - 原來它似乎是蜂巢基本上是到SQL聲明翻譯成MapReduce作業的方式。
hbase和「hive服務器」在Hive操作環境中的作用是什麼? Hive可以獨立成爲一個SQL - > MapReduce客戶端,還是這些困難的全局需求?
從github代碼中,我們可以看到這是一個由cloudera組成的冒煙測試模塊,它需要使用JDBC來'連接'Hive。但實際上,我們確實可以在沒有「服務器」或「HBase」的情況下使用配置單元。
1)對於服務器URL,它是從遠程Java API連接到節點服務器的URL。這裏的服務器就像Hive世界的門面(你可以參考here或下面的圖片)。服務器需要由hive --service hiveserver &
啓動。您可以跳過服務器並直接使用Hive CLI(嵌入模式),如here所述。 2)對於HBase,如果你不打算使用HBase,你可以不關心它。2)如果你不使用HBase,你可以不關心它。 Hive是一個數據倉庫工具,它可以處理位於HDFS,HBase等的數據。訪問HDFS很簡單,但訪問HBase有點複雜,使用"Hive-HBase-Integration"。