2017-10-20 35 views
0

創建Hadoop作業時,會爲其分配唯一的ID。例如,我剛剛運行了一個ID爲job_201709221002_0046的工作。看起來第一部分是某種時間戳,但這不是提交工作的日期。下劃線之後的部分似乎是連續的。 這是什麼意思?Hadoop作業ID是什麼意思?

編輯:我正在看的工作是一週。我剛剛在2017年10月20日星期五上午12點22分3秒提交了一份新表,並分配了工作編號job_201709221002_0047

+0

開始被日提交哪些材料?這可以澄清事情。我會說像UTC提交的日期? –

回答

2

表示當JobTracker的是started.In你的情況job_201709221002_0047它在JobTracker的運行第47工作,這在201709221002

Source

作業ID代表不可改變的唯一標識符的時間開始的時間爲了工作。 JobID由兩部分組成。第一部分表示jobtracker標識符,以便定義JobID到jobtracker映射。對於集羣設置,該字符串是jobtracker的開始時間,對於本地設置,它是「本地」。 JobID的第二部分是工作號碼。

一個例子作業ID是:job_200707121733_0003,它代表了第三份工作在JobTracker的運行在200707121733.