0
我有以下文件:Hadoop的聚合兩個功能
Item1 : frequencyOfItem1
Item2 : frequencyOfItem2
...
ItemN : frequencyOfItemN
一些行,我有後...
Pair1: Item1, Item2 Value1
Pari2: ItemX, ItemY Value2
....
PairN: ItemXN, ItemYN ValueN
我想在map-reduce方式下計算如下新值:
ParirX: ItemX, ItemY ValueX/FrequencyItemNX
我如何映射並減少這些值?
糟糕的值之間的DIVISIONE。數字搞砸了。無論如何。您可以用自定義可寫類 –
來解決這個問題,您可以提供解決方案的例子嗎? –
對不起,我幾年沒有寫mapreduce,但我只是「大聲思考」 –