我在Hadoop的新的,我有一個程序工作的那個地圖功能的輸入是一個文件,關鍵是這樣的:重點重新編號減少
ID: value:
3 sd
37 g
5675 gk
68 oi
我的文件大約10千兆字節,我想要更改這些ID並按降序重新編號。我不想改變這些值。 我的輸出必須是這樣的:
ID: value:
5675 sd
68 g
37 gk
3 oi
我想做這個工作節點的集羣?我怎樣才能做到這一點?
我認爲我需要一個全局變量,我不能在集羣中做到這一點?我能做什麼?
這是你會做多次的過程?或者這是一筆一筆交易? – greedybuddha 2013-05-07 18:04:31
@greedybuddha:我必須做一次。 – user1878364 2013-05-07 18:18:53