2012-06-14 84 views
9

我對Oozie的2.3股庫幾個問題:oozie如何處理依賴關係?

目前,我定義的共享庫中我們coordinator.properties:

oozie.use.system.libpath=true 
oozie.libpath=<hdfs_path> 

這裏是我的問題:

  1. 當份額庫被複制到其他數據節點,並有多少數據節點將獲得共享庫?

  2. 共享庫是否根據協調器作業中的wf數複製到其他數據節點,還是每個協調器作業只複製一次?

回答

8

將條目添加到oozie.libpath財產實際上意味着Oozie的將配置這些庫是在mapred.cache.files配置屬性(這是一個DistributedCache屬性)在您的工作流程的操作執行時。然後

的Hadoop會照顧複製的罐子,每個作業一次,每個集羣節點和任務,然後在類路徑配置屬性mapred.job.classpath.files

所以罐子配置爲響應你的第二個問題,他們會複製到工作流中的每個操作,而不是每個協調器作業一次。因此,如果您有一個具有4個mapreduce操作的wf作業,則該庫將在該工作流程的生命週期中被複制到每個任務跟蹤器(僅限那些參與mapreduce作業的任務跟蹤器)4次。

+0

是否有可能更新多個動作或wfs共享相同的分佈式緩存? –

+0

不知道我明白你在問什麼 –

+0

據我所知,這意味着從系統libpath的依賴將始終從HDFS加載,並避免每次工作流執行時使用分佈式緩存,是這樣嗎? – gphilip