2013-05-30 125 views
8

我有一個表,如下所示:分組蜂巢行

User:String Alias:String 
JohnDoe  John 
JohnDoe  JDoe 
Roger  Roger 

而且我想組一個用戶的所有別名,在一個陣列,在一個新的表,看起來像這樣:

User:String Alias:array<String> 
JohnDoe  [John, JDoe] 
Roger  [Roger] 

我不知道如何做到這一點與HiveQL.Do我必須爲此編寫一個UDF?

謝謝!

回答

11

退房built-in aggregate functioncollect_set

select 
    User, 
    collect_set(Alias) as Alias 
from table 
group by User; 
+0

絕對的:)謝謝! – C4stor

+0

是否有任何方法使用collect_set結構類型字段。 – rht

+0

謝謝@Lukas。 :) –