2014-03-25 48 views
1

有兩個HBase表(table1,table2)作爲輸入源,使用MapReduce比較table1中的一列與table2中的一列,如果table1中的一個與table2中的一個相等,將它們輸出到table3。HBase MapReduce,多表操作

我們如何使用MapReduce解決問題? (Hadoop2.2.0 + Hbase0.96.0)

回答

0

第一步 - 通過這個鏈接來了解HBase的表怎麼能源映射器:Hbase Table as Mapper source

來到你的具體問題,下一步: 您將有2映射器(即2個輸入)每個表一個。 根據表中的值減少。您可能需要一個複雜的鍵或值來指定來自Reducer中的哪個表值。在reducer中,如果value/key來自兩個表即兩個映射器,那麼你可以使用Hbase API(上面的鏈接也解釋了它的一個bot)寫入表中。