如果我們正在運行火花任務,讓我們說火花的邏輯迴歸,爲什麼Spark的第一次迭代速度很慢並且迭代更快?
第一次迭代火花將花費大約80秒,並且進一步它將花費1秒這是爲什麼?
這裏火花的內部行爲是什麼?我知道火花存儲在內存中的數據這就是爲什麼計算速度更快,但詳細的解釋會很好!
如果我們正在運行火花任務,讓我們說火花的邏輯迴歸,爲什麼Spark的第一次迭代速度很慢並且迭代更快?
第一次迭代火花將花費大約80秒,並且進一步它將花費1秒這是爲什麼?
這裏火花的內部行爲是什麼?我知道火花存儲在內存中的數據這就是爲什麼計算速度更快,但詳細的解釋會很好!
你在哪裏運行我們的作業集羣或獨立?也請提供影響 – FaigB
的代碼片段,也許80年代包括初始化,集羣部署等。 – Wang
@FaigB取任何火花代碼。我只是在問一個理論問題。 –