我目前正在爲SaaS近實時分析應用程序測試Redshift。 在100M行數據集上查詢性能很好。Amazon Redshift for SaaS應用程序
但是,當更多用戶同時使用應用程序時,每個羣集15個查詢的併發限制將成爲問題。
我不能緩存對所有的結果,因爲我們授權自定義每個查詢過濾器(即席查詢)
該應用程序的要求是:
- 查詢必須10S 內返回結果
- 使用超過100列的過濾器進行臨時查詢
- 從1到50個客戶端同時連接到應用程序
- 數據集牛逼增長在10M行/天的速度
- 典型的查詢是SELECT與聚合函數COUNT,AVG有1或2加入
紅移是不正確的這種使用情況?你會考慮哪些其他技術來滿足這些要求?
你確定允許直接查詢數據是正確的嗎?爲了使查詢運行更快,是否無法創建一些專門的事實或彙總表? – bstempi