2014-12-04 21 views
0

我將在分佈式應用程序上工作。數據將被流式傳輸和分析。另外,最終用戶需要儘快訪問最後一個流式數據。另外,我需要保持數據的備份並對其進行處理。緩存流數據的最後一個條目

我最初的想法如下: 1)保持redis作爲緩存來保存最後的條目。 2)MySQL - 存儲數據 3)Hadoop/Hbase - 便於存儲數據的方式來分析它。

您對這樣的設置有什麼看法?你會推薦別的嗎?

謝謝!

回答

0

我認爲Spark和Cassandra的組合是一個很好的選擇。 Cassandra可以輕鬆處理數據吞吐量和存儲。 Spark提供閃電快速分析。

+0

它看起來像DataStax [剛剛宣佈](http://www.datastax.com/2014/12/datastax-announces-dse-4-6-the-leading-database-platform)支持Spark Streaming,它可能正是你想要的。我知道他們在那裏有一個火花流媒體演示,可以讓你知道它是如何融合在一起的。 – mildewey 2014-12-04 21:20:53

相關問題