我有一個文件包含來自世界各地的所有國家的數據。Hadoop Pig Max命令
我想找出有最大機場的國家。
我已經寫了下面的代碼:
A = load 'airports.dat' USING PigStorage (',') AS(AirportID:int,Name:chararray,City:chararray,Country:chararray,IATA:chararray,IATAothers:chararray,Latitude:float,Longitude:float,Altitude:float,Timezone:float,DST:chararray,Zone:chararray);
B= GROUP A BY Country;
C= FOREACH B GENERATE A.Country, COUNT(A) AS Count;
但畢竟這我沒有得到如何找到最大。
任何人都可以請幫忙。
MAX「計算在單柱包的最大數值或chararrays的。」,所以它運行在值,而不是整個列。你必須訂購DESC和限制 –