2013-01-18 53 views

回答

2

檢查TrackerDistributedCacheManager.java代碼的更多細節。 Hadoop會保留一個引用計數,說明分佈式緩存中有多少個任務正在使用這些文件。如果計數降至0,則標記爲刪除的文件。因此,在作業結束時,將清理DistributedCache中的文件,否則它們將繼續在作業上的節點上堆積。

因此,您不能更改分佈式緩存中的文件並將其用於連續作業。

+0

+1爲鏈接 –

+1

所以,我有一個循環內的map-reduce作業。也就是說,根據減速器的輸出值,它決定再次重複整個過程。但是,映射器從distributedCache中讀取一個值。 distributedCache中的值在每次迭代中發生變化。有沒有辦法做到這一點? –

相關問題