2016-04-15 72 views
3

假設我有一個兩列的表CUSTTYPEAMOUNT。我想添加第三列NTILE,我可以再上組和使用,讓我的平均值,類似如下:獲得Apache Pig中每N個元組的平均值

CUSTTYPE | AMOUNT | NTILE 
----------+---------+---------- 
RETAIL | 78.00 | 1 
RETAIL | 234.00 | 1 
RETAIL | 249.00 | 1 
RETAIL | 278.00 | 2 
RETAIL | 392.00 | 2 
RETAIL | 498.00 | 2 
RETAIL | 500.00 | 3 
RETAIL | 738.00 | 3 
RETAIL | 1250.00 | 3 
RETAIL | 2029.00 | 4 
RETAIL | 2393.00 | 4 
RETAIL | 3933.00 | 4 

從本質上講,我試圖把每n項的平均值(這裏, N = 3):

CUSTTYPE | AMOUNT | NTILE 
----------+---------+---------- 
RETAIL | 187.00 | 1 
RETAIL | 389.33 | 2 
RETAIL | 829.33 | 3 
RETAIL | 2785.0 | 4 

從豬參考here,看來這可以用Over()可以實現,但我無法找到如何可以這樣做的例子。思考?

回答