我使用的火花Java API和我已經開始注意到,我無法解釋這種奇怪的事情重複的階段。正如你在火花:在使用加入
這是我的計劃執行的DAG可視化看到,無其他階段使用3級的計算,也是在第3階段的三種操作正是第2階段的前3個操作,所以我的問題,爲什麼第三階段是分開計算的?我還沒有最後連接操作,這樣做具有以下DAG這裏運行程序,
通知,有像前面的一個沒有平行的階段。我相信由於這個無法解釋的階段3,我的計劃正在放緩。
PS:我很新的火花,這是我的第一個計算器問題,請讓我知道這是題外話,或需要更多的細節。
你能顯示代碼?我可以嘗試重現自己,但會感謝您可能提供的任何幫助。謝謝! –
我_guess_是,它是在網絡用戶界面的問題,以圖表的RDD血統。你可以在'join'之後的RDD上加入'DebugString'並粘貼到你的問題上嗎? –