我有一個應用程序需要針對不同級別的聚合進行分析,這就是OLAP工作負載。我也想經常更新我的數據庫。任何可擴展的OLAP數據庫(Web應用程序規模)?
例如,這裏是我的更新是什麼樣子(架構是這樣的:時間,DEST,源IP,瀏覽器 - >訪問次數)
(15:00-1-2-2010, www.stackoverflow.com, 128.19.1.1, safari) --> 105
(15:00-1-2-2010, www.stackoverflow.com, 128.19.2.1, firefox) --> 110
...
(15:00-1-5-2010, www.cnn.com, 128.19.5.1, firefox) --> 110
然後我要問什麼是WWW的總訪問.stackoverflow.com從上個月的Firefox瀏覽器。
我知道Vertica系統可以以相對便宜的方式來執行此操作(性能和可擴展性明智,但不是成本明智的)。我在這裏有兩個問題。
1)有沒有一種開源產品可以用來解決這個問題?特別是,Mondrian系統的工作效果如何? (可伸縮性和性能) 2)是否有HBase或Hypertable基礎解決方案(顯然,裸體HBase/Hypertable不能這樣做)? - 但是如果有一個基於HBase/Hypertable的項目,可擴展性可能不會成爲IMO的問題)?
謝謝!
您的預期數據量是多少?每天點擊100萬次?千萬? – 2010-01-21 09:23:42