我使用豬生成的元組組如下:PIG:獲取所有元組進行分組的袋子
a1, b1
a1, b2
a1, b3
...
->
a1, [b1, b2, b3]
...
這是很簡單的工作。但我的問題是得到以下幾點:從獲得的團體,我想生成一組在該組的袋子所有元組:
a1, [b1, b2, b3]
->
b1,b2
b1,b3
b2,b3
,如果我能鳥巢「的foreach」這很容易,首次迭代在每個組上,然後通過它的包。
我想我誤解了這個概念,我會很感激你的解釋。
謝謝。
勞倫斯是正確的。這個UDF完全符合你的需求,它也比使用笛卡爾產品的純豬解決方案更有效率。順便說一下,URL已經改變了:[UnorderedPairs](http://datafu.incubator.apache.org/docs/datafu/1.2.0/datafu/pig/bags/UnorderedPairs.html) – matterhayes