我正在尋找一個分佈式時間序列數據庫,它可以在羣集設置模式和生產環境中自由使用,並且它必須適合hadoop生態系統。實時分析時間序列數據庫
我有一個IOT項目,基本上是每隔10分鐘或一個小時發送數據的150k傳感器,因此我試圖查看具有有用功能的時間序列數據庫,如聚合度量,下采樣,彙總(彙總)我在這個Google樣式表文檔time series database comparative中發現了這個比較。
我已經測試Opentsdb的hbaserowkey的數據模型,真的很適合我的使用情況:但窗臺需要爲我的使用情況進行開發的功能是:
- 總倍數指標
- 做彙總
我還測試keirosDB這是opentsdb的更豐富的API叉子和它使用卡桑德拉作爲後端存儲的東西是他們的API做的所有東西我找下采樣彙總查詢倍數指標和更多。
我已經測試過Warp10.io和Apache Phoenix,我已經在這裏閱讀Hortonworks link,它將被Ambari度量標準使用,所以我認爲它非常適合時間序列數據。
我的問題是截至目前最好的時間序列數據庫是什麼樣的實時分析與請求性能低於1S的所有類型的請求例如:我們希望50個傳感器在一段時間內發送的聚合數據的平均值5年重新採樣數月?
我認爲這樣的請求不能在1S下完成,所以我相信對於這樣的請求,我們需要一些彙總/預聚合機制,但我不太確定,因爲有很多工具,我不能決定哪一個最適合我的需要。