我正在尋找一個基於Hadoop的研究/實施項目,並且我發現了在wiki頁上發佈的列表 - http://wiki.apache.org/hadoop/ProjectSuggestions。但是,這個頁面最後在2009年9月更新。所以,我不確定這些想法是否已經實施。我對「MR框架中的排序和混洗優化」特別感興趣,它談到「在混洗之前結合機架或節點上的幾個映射的結果,這可以減少搜索工作和中間存儲」。Hadoop MapReduce中的排序和洗牌優化
有沒有人試過這個?這是在當前版本的Hadoop中實現的嗎?