我使用Hadoop開發Map/Reduce。 我的驅動程序程序將MapReduce作業(使用Map和Reduce任務)提交給Hadoop的Job跟蹤器。我有兩個問題: a)我的Map或reduce任務可以提交另一個MapReduce作業嗎? (使用相同的羣集Hadoop和相同的Job Tracker)。這意味着,我開始的驅動程序提交一個mapreduce作業,其中,map或reduce任務產生另一個MapReduce作業,並將其提交給同一個集羣Hadoop和同一個作業跟蹤器。我認爲這是可能的。但是我不確定。而且,這是一個好的解決方案?如果不是,我們能否有另一種解決方案?地圖減少地圖減少
二)我們可以用兩種地圖的任務(有兩個不同的功能和一個在MapReduce工作Reduce任務? 非常感謝
什麼是你試圖通過從MapReduce工作中推出MapReduce作業完成了嗎? – 2012-03-15 01:57:52
我有兩個輸入大型數據集(set1和set2)。對於set1的每個記錄元素,我需要集合2的所有元素才能處理它。所以我打算讓我的驅動程序將set1作爲輸入數據提交給mapreduce作業。然後,在Map Task中,爲了處理set1的記錄元素,我打算提交另一個輸入數據爲set2的mapReduce作業。我不知道這可能與否。我認爲這在理論上是可能的,但不可能,因爲沒有插槽可用。如果我的Map函數使用另一個JobTracker將另一個MapReduce作業提交給另一個Hadoop集羣,這是可能的嗎? – 2012-03-15 16:01:45