2
我的數據看起來像每幀10萬個數值(真實+二進制)(想想數組,即數組的一行中有1000萬個元素),並且大約有100個幀/第二。一種時間序列。數值數據 - 高容量+高速度+快速檢索
對我的挑戰是:
(1)存儲 - 數據
量(2)數據的處理速度
(3)實時分析
是卡桑德拉合適爲了這?任何人都可以在應用程序體系結構(Think hadoop,cassandra,kafka,storm等)上引導我一點,這將在上面的場景(從非常高的層面來看)中解決。
我知道我問過一些很大的東西。在實驗之前,我需要一個方向。
感謝您的分享。您能否更詳細地說明您將如何實時集成Hadoop + Storm?你是否建議有兩個獨立的部分 - 實時風暴和Hadoop的批處理? – Suman 2013-05-13 21:36:09