2013-04-10 82 views
0

我必須在hadoop 1.0.4許多(也許12個)作業中運行。我希望第一個並行運行,當所有完成並行運行4個其他作業並最後再次運行最後3個並行運行時。我如何在hadoop 1.0.4中設置它,因爲我發現所有作業都互相運行而不是並行運行。並行映射減少Hadoop中的作業

+0

使用oozie http://oozie.apache.org/ – banjara 2013-04-10 12:07:16

回答

2

JobControl API可用於MR作業依賴性。對於複雜的工作流程,推薦使用OozieAzkabanHere是Oozie與Azkaban,

+0

在我的情況下,我可以用戶的JobControl,這似乎很容易被使用? – 2013-04-10 13:13:25

+0

使用JobControl API必須使用命令job.waitForCompletion(true);每個作業結束後還是從JobControl自動完成? – 2013-04-11 10:54:38

+1

我有消息工作在狀態RUNNING而不是DEFINE – 2013-04-11 10:57:27

相關問題