1

這下面的程序,我試圖做到這一點在Apache的豬,因爲它是和非結構化數據MAX(計數)功能的Apache的Pig Latin

我)我有數據集包含街道名稱,城市和國家:

II)組由國家

三)我以國家的COUNT(*)的數據集現在我的O/p會像Statename的,算===>如何可能時間狀態是在數據集中

可用

程序:

realestate = LOAD DATA using pigstorage(',') as (street:string,city string,state string); 

A = GROUP realestate by state; 
B= FOREACH A GENERATE group , count (*) 

O/P會像

CA,14 華盛頓20

現在我需要的最大值(計數)我的輸出應該是「華盛頓20)

如何進行它。請幫助我解決問題

回答

1

應用ORDERLIMIT對生成的結果

realestate = LOAD DATA using pigstorage(',') as (street:string,city string,state string); 
A = GROUP realestate by state; 
B = FOREACH A GENERATE group , COUNT(realestate) as c; 

# Arrange the tuples based on the count in descending order 
D = order B by c desc; 

# Apply limit on the ordered result to get the Max value 
E = LIMIT D 1;