2016-04-07 66 views
-1

我是Cassandra的新手,現在根據我們的需求對它進行評估 - 我需要處理一個動態存儲器,它可以存儲來自多個來源的信號數據。每個信號源連同其元數據值一起提供連續的信號數據流(時間值序列)。 什麼是最好的數據模型,即使只是作爲一個起點,來處理這種數據?是否可以使用CQL將數據作爲向量插入(而不是通過樣本進行採樣)?任何具體例子的鏈接將高度讚賞!使用Cassandra進行時間序列數據存儲

感謝

更新:

非常感謝了有益的意見!我看了幾個例子,方法很清楚。不過我有兩個問題:

  • 我在一個單獨的行,而不是在單個行(cqlsh時間戳值夫妻見,例如,如果我插入3對時間戳值到相同的密鑰我期待着與3時間戳列得到它查詢1排
  • 是否可以插入值(和不重複插入)的載體?

感謝

+1

我最近在這裏回答了一個類似的問題:http://stackoverflow.com/questions/36048660/cassandra-partition-key-for-time-series-data/36050458#36050458 – Aaron

+0

否則,DataStax的Patrick McFadin撰寫的這篇文章是一個好的起點:https://academy.datastax.com/resources/getting-started-time-series-data-modeling – Aaron

+0

爲什麼不使用現有的時間序列數據庫,它是羣集的,併爲您完成上述所有功能? –

回答

1

是否有可能插入值的向量(a nd不重複插入)?

我希望你正在嘗試使用批處理執行。這是你的好起點。 http://docs.datastax.com/en/cql/3.1/cql/cql_reference/batch_r.html

或者您可能正在尋找集合類型。請注意,他們有自己的限制。 https://docs.datastax.com/en/cql/3.0/cql/cql_using/use_collections_c.html

正如其他答案中提到的,Patrick McFadin的文章應該讓你開始。

希望它有幫助!

相關問題