我目前正在研究一個Java EMR項目,其中我的密鑰由2個文本組成。 我在我的一個步驟中設置了NaturalKeyGroupingComparator,只比較鍵的左側部分。hadoop NaturalKeyGroupingComparator - Reducer中發生了什麼?
現在,這是對減速的Java代碼:
public void reduce(Pair key, Iterable<Data> values, Context context) throws IOException, InterruptedException{
int totalOccurrences=0;
for (Data value : values){
if (key.getRight().toString().equals("*")){
totalOccurrences+=value.getOccurrences();
}
else{
value.setCount(new IntWritable(totalOccurrences));
}
}
}
現在一切工作按計劃完全沒有問題,但我不明白這正是發生。 在減少運行中如何改變密鑰?