1
我是hadoop和mapreduce分區程序中的新成員。我想寫自己的分區程序,並且需要在分區程序中讀取文件。我搜索了很多次,我知道我應該使用分佈式緩存。這是我的問題,我該如何在我的hadoop分區器中使用分佈式緩存?我應該在分區器中寫什麼?如何在分區器hadoop中使用分佈式緩存?
public static class CaderPartitioner extends Partitioner<Text,IntWritable> {
@Override
public int getPartition(Text key, IntWritable value, int numReduceTasks) {
return 0;
}
}
感謝
感謝您的回覆。我很抱歉,但我真的很新,在這方面,我不明白這個分區器如何讀取文件。你有可能給我一個更簡單的例子嗎?謝謝 – saeednasehi
我didi它。謝謝 !謝謝 :)) – saeednasehi