2
我在獨立模式下設置了一個spark主站和一些slave的spark 1.2.1集羣。然後讓我的數據科學家享受集羣的力量。爲什麼在提交作業的機器中填充tmp(spark.local.dir)的火花?
所有工作正常。然而,我的數據科學家用來提交spark工作的專用服務器的spark.local.dir逐漸填滿。
由於本機是坐在集羣,不是高手,也不是工人/從站外,我也不會想到,當地spark.local.dir以任何方式火花使用。 (爲什麼會呢?這隻能說明日誌。)
我無法找到一個很好的文檔詳細介紹了這部分信息。有人有想法嗎?