2016-12-27 38 views
-1

我們正在研究hadoop多年。它用於分佈式數據存儲以及數據處理。現在我們已經知道火花是那個hadoop的垃圾。這是否意味着我們應該用火花取代hadoop生態系統?有人可以詳細說明嗎? 對於我們的場景,我們必須分析大量的數據,並且我們期望結果很快。這就是爲什麼我們想到Spark的使用。Spark是Apache Hadoop的替代品

回答

2

並非在所有...

的Hadoop = HDFS + YARN + MapReduce的

火花只是一個替代品的MapReduce即,而不是使用MapReduce的,可以使用火花數據的處理。當然SPARK更快更輕鬆。