3
假設我有一個兩列的表CUSTTYPE和AMOUNT。我想添加第三列NTILE,我可以再上組和使用,讓我的平均值,類似如下:獲得Apache Pig中每N個元組的平均值
CUSTTYPE | AMOUNT | NTILE
----------+---------+----------
RETAIL | 78.00 | 1
RETAIL | 234.00 | 1
RETAIL | 249.00 | 1
RETAIL | 278.00 | 2
RETAIL | 392.00 | 2
RETAIL | 498.00 | 2
RETAIL | 500.00 | 3
RETAIL | 738.00 | 3
RETAIL | 1250.00 | 3
RETAIL | 2029.00 | 4
RETAIL | 2393.00 | 4
RETAIL | 3933.00 | 4
從本質上講,我試圖把每n項的平均值(這裏, N = 3):
CUSTTYPE | AMOUNT | NTILE
----------+---------+----------
RETAIL | 187.00 | 1
RETAIL | 389.33 | 2
RETAIL | 829.33 | 3
RETAIL | 2785.0 | 4
從豬參考here,看來這可以用Over()
可以實現,但我無法找到如何可以這樣做的例子。思考?