我們試圖使用HBase來存儲時間序列數據。我們目前的模型將時間序列存儲爲單元格內的版本。這意味着單元最終可能會存儲數百萬個版本,並且此時間序列上的查詢將使用Get類中的setTimeRange方法檢索一系列版本,該方法在HBase中的Get類中提供。使用HBase存儲時間序列數據
例如
{
"row1" : {
"columnFamily1" : {
"column1" : {
1 : "1",
2 : "2"
},
"column2" : {
1 : "1"
}
}
}
}
這是在HBase中存儲時間序列數據的合理模型嗎?
將數據存儲在多列(是否可以跨列查詢)或行更合適的替代模型?
無論您是將時間步放在rowkey還是列限定符中,最好都可以通過您的數據訪問模式來確定。如果您通常傾向於獲取掃描中的所有列,並且刪除不是主要方案,那麼rowkey設計會有很大意義。 – Larsenal 2013-12-05 00:46:52