我有如下數據:如何使用ARRAY_AGG()聚合函數在豬或蜂房
================================================================
session_id screen_name screen_launch_time
================================================================
990004916946605-1404157897784 screen1 1404157898275
990004916946605-1404157897784 screen2 1404157898337
990004947764274-1435162269418 screen1 1435162274044
990004947764274-1435162269418 screen3 1435162274081
我想用一個array_agg
函數來獲得在下面的格式我的數據:
=========================================================
session_id screen_flow count
=========================================================
990004916946605-1404157897784 screen1->screen2 1
990004947764274-1435162269418 screen1->screen3 1
有沒有人試過編寫UDAF
或python
腳本來實現array_agg
函數中使用的邏輯?
請分享您的想法。
蜂巢有一個內置的'collect_set()'和'collect_list()',其聚合項的數組。這裏有一個udf,它可以做同樣的事情https://github.com/klout/brickhouse/tree/master/src/main/java/brickhouse/udf/collect – gobrewers14
嗨,它給了我這個錯誤: – explorethis
FAILED:ParseException行1:0字符''這裏不支持 – explorethis