我對cassandra比較陌生,必須評估不同的NoSQL解決方案以獲取監控工具。 一個數據只有大約100個字節,但其中有很多。 是否卡桑德拉適合我的需要:在一天,我們得到約15萬條記錄... 所以我目前900萬條記錄(約15GB的SQL-插入腳本)使用cassandra監控數據模型的技巧
我的第一個問題是測試?我需要做範圍查詢(在創建記錄的日期),並根據存儲在數據中的「二級索引」定義的組來總結一些列。)
我已經嘗試過MongoDB,但它確實很差MapReduce做了一個非常糟糕的工作... 我也讀過關於HBase,但它需要的巨大數量的配置使我希望可以有與Cassandra的解決方案...
第二個問題是:我可以如何存儲我的數據以上述方式訪問它? 我已經想到了一個超級列家族,關鍵是日期(自1970年以來),列將是當時的基準數據......但是如果我使用隨機分區器,我不能做快速範圍查詢(據我所知),如果我使用Order Preserving Partitioner,數據將不會散佈在我的羣集(當前由兩個節點組成)上。
我希望我給你所有必要的信息... 謝謝你的幫助!
安迪