2016-07-22 35 views
0
分開線

我已經轉換單線到多行和施加一些變換。現在我需要多行到單個逗號在PIG

我嘗試使用元組,但還沒有wrked,

D = foreach grouped generate group, COUNT(R); 
requestFile = foreach D generate (bag{tuple(chararray)}) D.group as abc:{(group:chararray)}; 
G = GROUP requestFile ALL; 
F = FOREACH G generate requestFile; 

d有個別單詞的次數和它重複計數,以每個單獨行轉換爲單行。

回答

0

您應該使用BagToTuple的壓扁到多行轉換爲單行喜歡在上面的代碼中,

D = FOREACH grouped generate group, COUNT(R); 
G = GROUP D ALL; 
F = FOREACH G generate FLATTEN(BagToTuple(D)) ;