2015-08-28 30 views
0

我爲從智能電錶接收數據的公司工作。這些數據可能會有2天的時間用於直播,並且可能會在發生錯誤(間隙等)時發佈。目前我們通常存儲這個5年。然後將數據拉入SSAS立方體並聚合成1分鐘,5分鐘,30分鐘,1小時,1天,1周,1個月的總計。對於這些聚合中的每一個,最小值,最大值,平均值也被存儲。 構建此多維數據集速度很慢,並且由於它從單一來源中挖掘其數據,因此目前不可擴展。RRD時間系列數據

我認爲每個數據點的RRD風格數據庫會更適合數據推送。 不過我對RRD幾個問題(示例將是最受歡迎的)

  1. RRD可以保留數據的粒度,同時也超過 時間長達執行卷?
  2. 是否可以將數據輸入RRD以糾正差距?

謝謝。

例子會受到歡迎

回答

1
  1. 是 - 你需要適當地配置您的RRA。

RRA是一個循環歸檔文件,它定義了數據點的數量和分辨率。所以,你可以 - 假設有5分鐘採樣率:

RRA:AVERAGE:0.5:1:2000 
RRA:AVERAGE:0.5:12:2400 

將持有5m左右分辨率的一週,1小時分辨率的100D。但是你可以很容易地擴展你的5米分辨率RRA--儘管它會讓你的RRD變大。問題是 - 你真的需要嗎? RRD的全部重點是自動歸檔與圖形分辨率 - 查看一年的統計數據,無論如何您都無法呈現5米分辨率。使用5m樣本,1600px寬的圖形只有6天左右。

  1. 是的,但是由於RRD的工作方式,這有點煩人。實際上,您必須提取並重放數據以填補空白。如果你正在'重放'你失去了解決方案的東西,這不一定會奏效,因爲你沒有足夠的樣本。你可以用rrdtool dump來提取XML格式的RRD內容,你也可以直接修改它,然後rrdtool restore它。如果你需要用任何實際的頻率做這個,我建議使用rrdtool以外的東西。
+0

不幸的是我問過這個要求是否是真正的要求之前,我聽說客戶希望本週與同一周進行比較(對齊週一至週五)-1y -2y -3y等。 m認爲RRD風格而不是RRDtool本身。 – Mark

+0

RRDtool會做到這一點,但你正在失去很多存檔的好處。沒有辦法解決這個事實,如果你想長時間保持高分辨率,你需要存儲大量的數據點。 – Sobrique