2013-03-21 50 views

回答

0

它實際上不是必須的。使用分佈式緩存的主要目的是使資源可用於在整個集羣中的所有節點上運行的所有映射器或簡化器,這在單臺機器上沒有太大意義。在單個節點的hadoop集羣上,你可以在你的mapreduce代碼中擁有一個全局變量,這可以做到這一點。

+0

是否可以在此語句後檢查文件是否存在於分佈式緩存中 DistributedCache.addCacheFile(new URI(otherArgs [2]),conf); – Lav 2013-03-22 04:51:19