我正在爲銷售人員開發應用程序。我無法弄清楚如何在我的應用程序中管理大數據。以下是情景。實時使用cassandra進行大數據處理
我根據以下標準劃分位置。
Country => State => City => Territory => Area => Outlet。
我的表格結構來管理日常銷售大致如下。
插座ID - 1,2,3,4,5,6 ......
用戶ID - EMP001,EMP002,EMP003,EMP004,EMP005,EMP006 ...
產品ID - 78 ,54,21,11,09,83 ..
數量 - 12,34,67,43,70,03 ..
日期&時間 - 2014年1月5日 - 11.00,01/05/2014 - 12.00,01/05/2014 - 14.00 ..
and oth er filelds。 基於上述數據結構,將會有許多報告將被實時查看。
我們每天有100萬行插入。我已經將Casandra作爲NO-SQL數據庫進行了縮小。
現在我需要一個可以查詢和管理實時分析的數據庫。聽說過並閱讀有關這些開源工具,如 - Hbase,Pig,Hive,Presto DB,Impala,Sharp,Shark等。
目前我無法判斷哪個是最適合我的應用程序實時分析和預測產品銷售。
我們將非常感謝您的幫助和指導。
謝謝
我想和Presto一起去,但除了Presto網站,我沒有找到很多信息。 –