我遇到以下問題:我的系統每天從不同站點收集約300M點擊量。 每個人都有時間,用戶ID,類型(廣告或慣常),http地址,站點ID。爲快速網站分析選擇DB,OLAP解決方案(大數據陣列)
也有一批用戶〜200M,其中有性別,年齡組和國家。
要求設計一個基於點擊數據的系統,可以實時報告不同用戶羣的點擊率。就像OLAP解決方案:-)
例如,繪製圖表上命中女孩15-25歲,英國,從10月到九月,2011年
的數據庫您推薦選擇和解決方案來構建OLAP多維數據集?
我正在尋找開源解決方案,如HBase(+ zohmg或級聯)Hypertable或其他(免費DWH :-))。
我忘了提及:預聚合數據可能存在的一個問題是用戶的信息可能會改變。例如,如果用戶遷移到其他國家/地區,那麼他們仍將計入他們之前的國家,以進行您已完成的預彙總。根據您的業務規則,這可能是可取的,或者它可能不符合要求。 – ajduff574
另外:如果您希望對每個查詢統計* unique *用戶(而不是總點擊率),則此預集合將無法工作。 – ajduff574