我需要在兩個作業中拆分我的Map Reduce jar文件,以獲得兩個不同的輸出文件,一個來自兩個作業的每個reducer。Map Reduce:ChainMapper和ChainReducer
我的意思是第一份工作必須產生一個輸出文件,該文件將成爲鏈中第二份工作的輸入。
我讀了一些關於ChainMapper和ChainReducer的hadoop版本0.20(目前我使用的是0.18):這些可以滿足我的需求嗎?
任何人都可以建議我一些鏈接在哪裏找到一些例子,以使用這些方法?或者也許有另一種方法來實現我的問題?
謝謝
盧卡