0
我在寫一個hadoop作業,應該收集集羣中運行的所有作業的開始和結束時間,並將這些數據上傳到blob。但是,我不知道如何獲得這些信息,因爲工作似乎無法訪問作業跟蹤器。有任何想法嗎?從作業中獲取hadoop集羣信息
我在寫一個hadoop作業,應該收集集羣中運行的所有作業的開始和結束時間,並將這些數據上傳到blob。但是,我不知道如何獲得這些信息,因爲工作似乎無法訪問作業跟蹤器。有任何想法嗎?從作業中獲取hadoop集羣信息
您可以使用JobInProgress提供的getLaunchTime()和getFinishTime()方法。該API還有一個JobTracker類,該類提供getJobsFromQueue(String queue)方法,該方法可用於獲取提交給特定隊列的所有作業。
除了這些方法,這些類還有一些其他非常有用的方法,您可能會發現有幫助。
HTH