我聽說新術語Data Lake。我GOOGLE了,得到了Hadoop Vs Data Lake
數據湖是一個大型的存儲庫和處理引擎。數據湖爲任何類型的數據提供「大容量存儲,巨大的處理能力和處理幾乎無限的併發任務或作業的能力」
術語數據湖通常與面向Hadoop的對象存儲相關聯。在這種情況下,首先將組織的數據加載到Hadoop平臺中,然後將業務分析和數據挖掘工具應用於駐留在Hadoop的商品計算機羣集節點上的數據。
同樣的事情是由Hadoop完成的。我們有HDFS for Storage和MapReduce for Computation。 我對Hadoop和Data湖有點混淆。兩者有什麼區別。如果它們與此術語出現的原因相同。或者如何定義數據湖。
更多選擇和使用業務分析框架? hadoop需要更多的瞭解如何將外部分析算法集成到MapReduce中,如果我沒有弄錯的話 – AchmadJP
我今天聽說過它的可憐我。 LOL –