2016-02-07 26 views
0

我正在使用Azure流分析進行實時分析,我有一個基本問題。我有一個我想要統計消息數量的字段。 的JSON是按以下格式:Azure流分析 - 長時間生活計算

{ categoryId: 100, name: 'hello' } 

我希望看到按類別張數,所以我認爲在Azure中的分析數據查詢應該是:

SELECT 
    categoryId, 
    count(*) as categoryCount 
INTO 
    categoriesCount 
FROM 
    categoriesInput 
GROUP BY 
    categoryId 

問題是我必須將TumblingWindow或SlidingWindows添加到group by子句中。有沒有辦法避免這種情況,並使計算無限期地運行?另外我需要確保輸出寫入SQL服務器。

+0

正如你所說,你需要彙總是有時限的,否則的分析數據將永遠不會返回任何行,因爲它會不斷地等待更多的行到達。也許輸出每5分鐘按類別計算一次,然後在SQL Server內進行額外匯總?告訴我們你想要完成什麼,然後我們可以幫助你更好地指導你。 – GregGalloway

+0

非常感謝此更新。我試圖通過實時計算來計算每個categoryId的出現次數(計數)。如果我每隔5分鐘輸出一次結果,那麼每次讀取數據時都必須總結一下,而這正是我試圖通過使用天藍色流分析來節省的數據...... –

+0

嗨,你還在這個問題? – neolursa

回答

0

長度爲「1」的滑動窗口如何?這樣它就像一個指針,每次它改變,你可以做計算?

希望這會有所幫助!

梅特