2013-09-27 85 views

回答

1

我想你會發現下面的文章非常有用你的想法。

It’s important to divide the techniques of data warehousing from the implementation. Hadoop (and the advent of NoSQL databases) will auger the demise of data warehousing appliances and the 「traditional」 single database implementation of a data warehouse. 
It is safe to say that traditional, single server relational databases or database appliances are not the future of big data or data warehouses. 
On the other hand, the techniques of data warehousing to include Extract-Transform-and-Load (ETL), dimensional modeling and business intelligence will be adapted to the new Hadoop/NoSQL environments. 

來源: http://gcn.com/blogs/reality-check/2014/01/hadoop-vs-data-warehousing.aspx

6

我知道,這是一個較老的線索,但在去年左右有一些發展。比較數據倉庫和Hadoop就像比較蘋果和橙子。數據倉庫是一個概念:清晰,高質量的集成數據。我認爲數據倉庫的需求不會很快消失。 Hadoop另一方面是一項技術。它是處理大量數據的分佈式計算框架。過去的數據倉庫通常建立在關係數據庫和數據倉庫設備上。然而,在過去幾年中,RDBMS出現了各種限制(面對數據量增長,許可成本爆炸式增長,不適合用於查詢圖表和層次結構以及攝取非結構化數據類型等)。與此同時,出現了Hadoop上的MPP SQL查詢引擎,例如Apache Drill,現在可以查詢Hadoop上的數據。

如果您對所有的細節感興趣,我已經撰寫了關於這個主題的一系列文章。 Data Warehousing in the age of big data. The end of an era?

1

我發現這個http://www.b-eye-network.com/view/17017描述大數據和數據倉庫的

當我們比較大的數據解決方案,數據倉庫的差異,我們怎麼 找?我們發現大數據解決方案是一項技術,倉儲數據是一種架構。他們是兩個完全不同的東西。 A 技術就是這樣 - 一種存儲和管理大量數據的手段。數據倉庫是組織數據的一種方式,因此具有公司的可信度和完整性。當有人從 數據倉庫中獲取數據時,該人員知道其他人正在使用相同的 數據用於其他目的。當存在數據倉庫時,存在數據對帳的基礎 。

相關問題