2016-03-16 50 views
0

我正在尋找從Hive中的集合中選擇最近項目(日期)的方法。例如,一個具有如下表t1Hive:從集合中選擇最近的項目

item  date 
a   2016-01-01 
a   2016-02-04 
b   2016-01-10 

hive> select item, collect_set(date) as dates from t1 group by item; 

我有

item  dates 
a   [2016-01-01, 2016-02-04] 
b   [2016-01-10] 

所以現在我需要擺脫absolete日期,即創建表像

item  date 
a   2016-02-04 
b   2016-01-10 

任何人都可以幫忙嗎?

回答

0

只需使用max()

select item, max(date) as date 
from t1 
group by item; 

如果你真的想要一個新的表,你可以使用create table as