2013-09-29 64 views
5

當我在閱讀關於延遲公平調度in this slide時,我對Hadoop中的術語「作業調度」和「任務調度」有些困惑。Hadoop中的作業和任務調度

請糾正我,如果我在下面的假設是錯誤的:

  1. 默認調度,調度能力和公平調度在作業級別是唯一有效的多個作業時,由用戶預定。如果系統中只有單一工作,他們不起任何作用。這些調度算法形成「作業調度」的基礎

  2. 每個作業可以有多個映射和減少任務,它們是如何分配給每臺機器的?如何安排一項工作的任務?什麼是「任務調度」的基礎?

+1

我不確定你在說什麼。我打開了你正在鏈接的演示文稿,沒有任何單一的術語「作業調度」或「任務調度」。我還看了一篇完整的論文,沒有提到「任務調度」,只提到了「作業調度」,作者解釋了作業調度如何在Hadoop中工作(版本1,而不是版本2 )。請在延期時間表或演示文稿中指出令您感到困惑的具體部分。 – cabad

+0

我不明白幻燈片6和7顯示了每個作業的計劃任務。 – GoT

回答

5

公平調度的情況下,當有運行一個作業,該作業使用整個集羣。當提交其他作業時,空閒的任務插槽將分配給新作業,以便每個作業獲得大致相同的CPU時間量。

默認Hadoop調度程序(它構成一個作業隊列)不同,它可以讓短時間作業在合理的時間內完成,同時不會使長時間作業捱餓。這也是在多個用戶之間共享羣集的簡單方法。公平分享也可以與工作優先級一起工作 - 優先級被用作權重來確定每個工作得到的總計算時間的比例。

CapacityScheduler旨在允許共享大型羣集,同時爲每個組織提供最低容量保證。其核心思想是Hadoop Map-Reduce集羣中的可用資源根據計算需求分爲多個集體資助集羣的組織。還有一個額外的好處是,一個組織可以訪問任何多餘的容量不被他人使用。這爲組織提供了具有成本效益的彈性。

+0

所以我可以假設如果系統中只有一個作業,作業調度程序類型不起任何作用 – GoT

+0

如果系統中只有一個作業,那麼該作業的不同機器上的任務是如何安排的? – GoT

+1

在公平調度程序的情況下,任務就像上面提到的那樣使用整個羣集的功能。 –