我有這樣的表格,代表一個會員在一個月內購買過產品。該月從201501到201612. 我想得到一個新表,其中包含兩列:一個是從201501到201612的月份,另一個是count(distinct member_srl)作爲member_rolling,記錄在那個月。 例如,新表的一個記錄是「201605 123456」,在月> ='201505'和月<'201605'的條件下,編號123456是計數(distinct member_srl)。 那麼如何以簡單的方式和快速的方式來實現這一點?如何在Hive的每個時間窗口統計不同的成員?
member_srl month
21197731 201501
14353419 201509
42129336 201605
10599714 201611
16162595 201501
50487249 201601
14899586 201604
29611434 201607
15374407 201608
14479686 201501
1621671 201502
20814896 201512
8185190 201501
57833156 201601
5215620 201503
60407250 201602
3510594 201501
25221577 201611
2120126 201512