2
假設我有以下數據集: -如何使用PIG查找給定數據集中的最大年份?
Year Temp
1974 48
1974 48
1991 56
1983 89
1993 91
1938 41
1938 56
1941 93
1983 87
我想我最後的答案是93(與到1941年)。我可以找到每年的最高溫度(說1941-93),但無法找到最大值。任何建議表示讚賞。
謝謝,
假設我有以下數據集: -如何使用PIG查找給定數據集中的最大年份?
Year Temp
1974 48
1974 48
1991 56
1983 89
1993 91
1938 41
1938 56
1941 93
1983 87
我想我最後的答案是93(與到1941年)。我可以找到每年的最高溫度(說1941-93),但無法找到最大值。任何建議表示讚賞。
謝謝,
你可以用兩種方法解決這個問題。
選項1:使用(集團ALL + MAX)
A = LOAD 'input' USING PigStorage() AS (Year:int,Temp:int);
B = GROUP A ALL;
C = FOREACH B GENERATE MAX(A.Temp);
DUMP C;
輸出:
(93)
選項2:使用(ORDER和LIMIT)
A = LOAD 'input' USING PigStorage() AS (Year:int,Temp:int);
B = ORDER A BY Temp DESC;
C = LIMIT B 1;
D = FOREACH C GENERATE Temp;
DUMP D;
輸出:
(93)