0
我有一個文件銀行名稱,位置和其他幾個領域。我想找出最大分行的銀行。豬::從一組的COUNTs獲取MAX值
A = LOAD 'bank.txt';
B = GROUP A by $0;
C = FOREACH B GENERATE COUNT($1);
我去銀行明智的計數。現在我堅持如何引用C來獲得擁有MAX分支機構的銀行。
我有一個文件銀行名稱,位置和其他幾個領域。我想找出最大分行的銀行。豬::從一組的COUNTs獲取MAX值
A = LOAD 'bank.txt';
B = GROUP A by $0;
C = FOREACH B GENERATE COUNT($1);
我去銀行明智的計數。現在我堅持如何引用C來獲得擁有MAX分支機構的銀行。
由於您正在按Bank進行分組,因此您必須生成分組並計算代表分支的字段,然後按count desc命令並獲取最上一行。
A = LOAD 'bank.txt';
B = GROUP A by $0;
C = FOREACH B GENERATE group as Bank,COUNT(B.Branches_Field) cnt;
D = ORDER C BY cnt DESC;
E = LIMIT D 1;
DUMP E;