2016-04-25 26 views
0

我有一個文件銀行名稱,位置和其他幾個領域。我想找出最大分行的銀行。豬::從一組的COUNTs獲取MAX值

A = LOAD 'bank.txt'; 
B = GROUP A by $0; 
C = FOREACH B GENERATE COUNT($1); 

我去銀行明智的計數。現在我堅持如何引用C來獲得擁有MAX分支機構的銀行。

回答

1

由於您正在按Bank進行分組,因此您必須生成分組並計算代表分支的字段,然後按count desc命令並獲取最上一行。

A = LOAD 'bank.txt'; 
B = GROUP A by $0; 
C = FOREACH B GENERATE group as Bank,COUNT(B.Branches_Field) cnt; 
D = ORDER C BY cnt DESC; 
E = LIMIT D 1; 
DUMP E;