1
這下面的程序,我試圖做到這一點在Apache的豬,因爲它是和非結構化數據MAX(計數)功能的Apache的Pig Latin
我)我有數據集包含街道名稱,城市和國家:
II)組由國家
三)我以國家的COUNT(*)的數據集現在我的O/p會像Statename的,算===>如何可能時間狀態是在數據集中
可用程序:
realestate = LOAD DATA using pigstorage(',') as (street:string,city string,state string);
A = GROUP realestate by state;
B= FOREACH A GENERATE group , count (*)
O/P會像
CA,14 華盛頓20
現在我需要的最大值(計數)我的輸出應該是「華盛頓20)
如何進行它。請幫助我解決問題