8
當我使用spark運行作業時,我得到以下日誌?火花日誌中的階段意味着什麼?
[Stage 0:> (0 + 32)/32]
這裏32對應於我要求RDD的分區數。
但是我不明白爲什麼會出現多個階段以及每個階段究竟發生了什麼。
每個階段顯然需要很多時間。是否有可能在更少的階段完成?
當我使用spark運行作業時,我得到以下日誌?火花日誌中的階段意味着什麼?
[Stage 0:> (0 + 32)/32]
這裏32對應於我要求RDD的分區數。
但是我不明白爲什麼會出現多個階段以及每個階段究竟發生了什麼。
每個階段顯然需要很多時間。是否有可能在更少的階段完成?
看看這個演示文稿,它很好的解釋了https://spark-summit.org/2014/talk/a-deeper-understanding-of-spark-internals – ccheneson