我可以將幾個映射器類設置爲一個工作嗎?Hadoop幾個映射器
例如我有一個來自HDFS的csv輸入文件。我有兩個任務要做。第一個是從csv輸入文件中計數兩個字段並將結果輸入到輸出文件中。第二個是從同一個csv輸入文件中計算另外兩個字段,並將結果導入另一個輸出文件。減速機是一樣的。
我怎樣才能實現這一點只是使用一個工作,並使他們在同一時間? (我不想做第一個,然後在第一個完成後做第二個,我想讓他們平行過程)。
我試試下面的代碼:
job1.setMapperClass(Mapper1.class);
job1.setReducerClass(LogReducer.class);
job1.setMapperClass(Mapper2.class);
job1.setReducerClass(LogReducer.class);
我嘗試,但它不能正常工作,它只是讓我第二個結果,第一個是消失。