0
我可以理解,它將任務分解爲幾個並行的機器,以提高性能,並結合使用谷歌的地圖縮減算法獲得最終結果,但我無法理解除了它取代傳統rdms以外的其他方式?hadoop是oltp還是olap軟件,它可以實時工作嗎?它用什麼來取代現有的系統?
我可以理解,它將任務分解爲幾個並行的機器,以提高性能,並結合使用谷歌的地圖縮減算法獲得最終結果,但我無法理解除了它取代傳統rdms以外的其他方式?hadoop是oltp還是olap軟件,它可以實時工作嗎?它用什麼來取代現有的系統?
Hadoop核心只是HDFS(分佈式文件系統)和MapReduce(並行處理計算框架)。今天它發展成爲一個可以做很多事情的生態系統。 Hadoop中可能沒有太多的OLTP工作負載,但肯定有OLAP工作負載。許多人將DW/BI(DataWarehouse和Business Intelligence)工作負載卸載到Hadoop。實時流媒體和處理是一個突出的用例(使用風暴等)。當它可能建成時,它並不是要取代任何系統,而是解決當時沒有很多既定系統/模式的互聯網規模問題。但是,如今,憑藉其龐大的生態系統和功能,它可以用於DW,NoSQL,流媒體,消息傳遞,機器學習,SQL等.....(列表如下)