2011-08-02 37 views
7

在關係數據庫管理系統,如MySQL數據庫thereis,是否有數據庫還對蜂巢?正如我在手冊上閱讀,蜂巢只表,我有點迷惑一下吧..RDBMS和Hive有什麼不同?

,什麼是RDBMS和蜂巢的不同概念?

韓國社交協會前

回答

6

基本上,蜂巢是建立在MapReduce的類似SQL的腳本語言。當您發出命令時,命令將被解釋並在分佈式系統上運行。由於被壓縮的文件是平坦的,因此它相當於在Hadoop中運行等效代碼並收集數據。整個流程比使用Mysql時慢得多。

+0

我不知道,慢多少?併爲此使用?有時,即使是unix行命令排序也比mysql排序更快。 – arivero

+0

如果事物沒有編入索引,Mysql可能會很慢,但是如果它們是這樣的話,它幾乎肯定會比配置單元快得多。 – delmet

8

RDBMs數據庫與Hive的主要區別在於專業化。雖然MySQL是適用於事務處理(OLTP)和分析(OLAP)的通用數據庫,但Hive僅用於分析。技術上主要的區別是缺少更新/刪除
功能。數據只能被添加和選擇。與此同時,Hive能夠處理MySQL或其他傳統RDBMS無法處理的數據量(以不幸的預算)。 MPP(海量並行處理)數據庫與Hive的功能最爲接近 - 儘管它們具有完全的SQL支持,但它們可以擴展到數百臺計算機。 另一個嚴重的不同 - 是查詢語言。
即使在select中,Hive也不支持完整的SQL,因爲它的實現。在我看來,主要區別在於任何其他條件均等的情況下缺乏連接。 Hive查詢語言sintax也有點不同,因此您無法將報表生成軟件連接到Hive。

0

這不是對原始問題的回覆,但它似乎超過了最大評論尺寸47個字符。

當您使用HDFS和Hive使用OLAP數據倉庫時,並不完全禁止更新事實數據。通過交換舞臺和倉庫之間的分區,您可以像許多基於RDBS的良好數據倉庫那樣執行此操作。在蜂巢表分區實現爲HDFS目錄,因此交換分區(幾乎)瞬間:它重命名HDFS目錄所需的時間。那麼,你就必須直接調用HDFS,繞過蜂巢界面,你可能會採用直MapReduce的維護階段,但由我工作的公司開發的datawarehouses,它被證明是一個不錯的辦法。

0

對蜂巢一個很好的參考,它是如何從傳統的數據庫不同,可以在後Hive- A SQL like database over Hadoop在我的博客上讀到:Hadoop,HDFS, Map-Reduce and Hive

1

蜂巢在Facebook的發明和它只是像SQL,但與內部的支持很少查詢。它可以讓你使用所有類型的連接,集團的功能在SQL還提供用戶自定義函數(UDF),它可以在Java或其他語言編寫,可以在蜂巢中使用。

當數據量較大,這樣的分區或集羣可以做,它不是一般用於單行插入或更新,我們在SQL做蜂巢主要使用。

2

蜂巢VS傳統的數據庫 蜂巢 - >架構上閱讀 - 這是當它的加載 傳統的數據庫--->上寫架構中的數據不驗證架構 - 表模式在數據加載時間我執行。如果要加載的數據E開不那樣的話適形架構,將拒絕

蜂巢 - >這是在非常低的成本易於擴展
傳統的數據庫--->沒有太多的可擴展性,成本擴大規模。

蜂巢 - >它基於Hadoop的符號,它是寫一次,讀多次
傳統的數據庫--->在傳統的數據庫中,我們可以讀取和寫入許多時間 蜂巢 - >記錄水平的更新是不可能的在蜂巢
傳統的數據庫--->記錄水平的更新,插入和刪除 ,交易和指標都是可能

蜂巢 - > OLTP(聯機事務處理)尚不支持蜂巢,但它支持OLAP (在線分析處理) 傳統數據庫---> OLTP(在線事務處理)和OLAP(在線分析處理)在RDBMS中得到支持。

否則請檢查下面的網址

https://sensaran.wordpress.com/2016/01/30/comparison-with-hive-with-traditional-database/

+0

從版本0.14配置單元支持記錄級別更新。 – Sonu

相關問題