我是hadoop和mapreduce分區程序中的新成員。我想寫自己的分區程序,並且需要在分區程序中讀取文件。我搜索了很多次,我知道我應該使用分佈式緩存。這是我的問題,我該如何在我的hadoop分區器中使用分佈式緩存?我應該在分區器中寫什麼? public static class CaderPartitioner extends Partitioner<Text,IntWritable> {
我寫我自己的自定義分區程序(舊的API)下面是我在哪裏擴展分區程序類的代碼: public static class WordPairPartitioner extends Partitioner<WordPair,IntWritable> {
@Override
public int getPartition(WordPair wordPair, IntWritable i