我跑了火花外殼以下工作:星火UI DAG階段斷開
val d = sc.parallelize(0 until 1000000).map(i => (i%100000, i)).persist
d.join(d.reduceByKey(_ + _)).collect
星火UI顯示三個階段。階段4和5對應於d
的計算,並且階段6對應於對collect
動作的計算。由於d
持續存在,我預計只有兩個階段。然而階段5目前沒有連接到任何其他階段。
所以嘗試沒有堅持用運行相同的計算,以及DAG貌似相同,只是沒有表示RDD的綠點已經堅持。
我期望級11的輸出是連接到平臺12的輸入,但事實並非如此。
看着舞臺描述,階段似乎表明d
正在持續,因爲階段5有輸入,但我仍然困惑,爲什麼階段5甚至存在。