2016-11-07 111 views

回答

2

總之,作業執行時間是掛鐘時間

這意味着時間仍然是測量,而階段實際上並沒有計算,集羣可能是忙着做的之間的任何東西你的工作的各個階段

這也可能工作在相反的方向:雖然多個階段並行執行,階段執行時間的總和可能會大於作業執行時間。

+0

如果數據庫讀取操作位於spark任務中,是獲取計算的所有數據還是不在階段持續時間中所需的時間? – guilhermecgs