我希望儘可能高效地存儲大量的時間序列。速度很重要,但不如存儲重要。在cassandra中存儲TB的統一時間序列
我的數據包含股票的名稱,後面跟着15分鐘的1分鐘數據。 數據開始精確於2000年1月1日,每天的分鐘數恰好爲390.
所以我不需要存儲每個系列的時間戳,因爲我可以自動計算。
因此,而不是這樣的:
Apple [timeStamp:value][timeStamp:value]
我想這一點:
Apple [value][value]
有沒有辦法所以只存儲連續值加載這種在卡桑德拉的數據,而不是每個值的時間戳。
推測,通過使用每個系列的時間戳,它會使所需的存儲空間增加一倍:如果每個時間戳和值都是8個字節,那麼如果僅存儲值,則佔用50TB而不是25TB。