2015-11-19 150 views
0

我有一年的15分鐘間隔數據在我的kairosdb。我需要依次執行以下操作: - 使用標記過濾數據 - 使用少量標記對過濾的數據進行分組。我沒有指定標籤的值,因爲我希望它們在運行時根據標籤值自動分組。 - 曾經分組在這些標籤上,我想彙總總和15分鐘間隔數據到一個月。kairosdb聚合組由

我寫了這個查詢,從基於kairosdb谷歌代碼論壇上提供的信息的python腳本運行。但彙總的值似乎不正確。產量似乎偏斜。我想知道我出錯的地方。我在python中這樣做。這裏是我的JSON查詢:

agg_query = { 
      "start_absolute": 1412136000000, 
      "end_absolute": 1446264000000, 
      "metrics":[ 
       { 
       "tags": { 
        "insert_date": ["11/17/2015"] 
       }, 
       "name": "gb_demo", 
       "group_by": [ 
        { 
         "name": "time", 
         "range_size": { 
          "value": "1", 
          "unit": "months" 
         }, 
         "group_count": "12" 
        }, 
        { 
         "name": "tag", 
         "tags": ["usage_kind","building_snapshot_id","usage_point_id","interval"] 
        } 
       ], 
       "aggregators": [ 
        { 
         "name": "sum", 
         "sampling": { 
          "value": 1, 
          "unit": "months" 
         } 
        } 
       ] 
       } 
       ] 
      } 

參考:數據是這樣的: [1441065600000,53488],[1441066500000,43400],[1441067400000,44936],[1441068300000,48736],[1441069200000 ,51472],[1441070100000,43904],[1441071000000,42368],[1441071900000,41400],[1441072800000,28936],[1441073700000,34896],[1441074600000,29216],[1441075500000,26040],[1441076400000,24224 ],[1441077300000,27296],[1441078200000,37288],[1441079100000,30184],[1441080000000,27824],[1441080900000,27960],[1441081800000,28056],[1441082700000,29264],[1441083600000,33272] [1441084500000,33312],[1441085400000,29360],[1441086300000,28400],[1441087200000,28168],[1441088100000,28944],[1443657600000,42112],[1443658500000,36712],[1443659400000,38440],[1443660300000 ,38824],[1443661200000,43440],[144 3662100000,42632],[1443663000000,42984],[1443663900000,42952],[1443664800000,36112],[1443665700000,33680],[1443666600000,33376],[1443667500000,28616],[1443668400000,31688],[1443669300000, 30872],[1443670200000,28200],[1443671100000,27792],[1443672000000,27464],[1443672900000,27240],[1443673800000,27760],[1443674700000,27232],[1443675600000,27824],[1443676500000,27264] ,[1443677400000,27328],[1443678300000,27576],[1443679200000,27136],[1443680100000,26856]]

這是一些2015年9月和10月的數據快照。當我運行這個時, 9月的時間戳,它會正確地累計9月份的數據,但是10月份它不會。

回答

0

我相信您的小組會按照日曆月份(1月至12月)創建小組,但您的總和聚合器會按照您的開始日期開始的運行月份對值進行求和......這似乎有點奇怪。這是你看到的原因嗎?

這是什麼數據?什麼是彙總結果?

+0

是的,結果有點奇怪。僅在第一個月正確完成聚合,因爲其餘值不準確。你能不能詳細說明你通過運行月總和聚合者總結你的意思。任何建議我如何解決這個問題。在數據中,我有一年的15分鐘間隔數據,我需要彙總並創建每月數據。 – Shilpi

+0

按時間分組功能將按日曆月份創建集羣。我不建議這麼做,因爲如果你查詢一年以上的數據,你會在不同年份的同一月份總結upp。只需設置每月聚合器,並在聚合器選項中使用align_sampling = true。 – Loic

+0

非常感謝Loic。這種工作。現在正在總結不同的月份。但結果稍微偏離。 – Shilpi