2010-07-20 67 views
1

基本上,我需要將數據路由到正確的Reducer。每個Reducer將成爲TableReducer。每個HBase表的Reducer

我有以下文件

venodor1,用戶1,XXXX = N venodor1,用戶1,XXXX = N venodor2,用戶2,XXXX = N venodor2,用戶2,XXXX = N

我需要插入下列HBase的表中

表的供應商1: [USER1] => {數據:XXXX = N} [USER2] => {數據:XXXX = N}

表供應商2: [USER1] => {數據:XXXX = N} [USER2] => {數據:XXXX = N}

格式爲[ROW_ID] => {[FAMILY]:[COLUMN] = [VALUE]}

  • 每個供應商具有不同的HBase的表
  • 行需要去不同HBase的表基體上的線的值。

有沒有辦法做到這一點?級聯?有沒有另外的工作呢?

感謝, 費德里科

回答

0

我找到了辦法......讓減速處理表。 而不是使用TableReducer,只需使用Reducer即可。 在設置加載表(表格應該是屬性)時,將自動刷新設置爲false並設置緩衝區大小。 清理所有表上的flushCommit()。 Reducer輸出對於Key和Value應該是NullWritable(除非你確實想輸出)。在減少只要做table1.put tabe2.put等

TableReducer實現它是這樣做在一個表的引擎蓋下。