Hbase - Hadoop：TableInputFormat擴展

使用一個hbase表作爲我的輸入，其中的鍵我已經預處理，以包含一個數字連接到各自的行ID，我想放心，所有行與在M/R作業中將從同一個映射器處理相同編號的標題。我知道這可以通過擴展TableInputFormat來實現，並且我已經看到了一個或兩個關於這個類的擴展的帖子，但是我正在尋找特別是這樣做的最有效的方法。Hbase - Hadoop：TableInputFormat擴展

如果有人有任何想法，請讓我知道。

來源

2012-07-16 user1519128

您可以在掃描中使用PrefixFilter。 http://hbase.apache.org/apidocs/org/apache/hadoop/hbase/filter/PrefixFilter.html

並採用未來

final Future<Boolean> newJobFuture = executor.submit(new Callable<Boolean>() { 
     @Override 
     public Boolean call() throws Exception { 
      Job mapReduceJob = MyJobBuilder.createJob(args, thePrefix, 
        ...); 
      return mapReduceJob.waitForCompletion(true); 
     } 
    });

並行推出的不同映射器，但我相信這是更你正在尋找一個減速的方法。

來源

2013-06-04 05:22:20

Hbase - Hadoop：TableInputFormat擴展

回答

相關問題