我從一個shell腳本提交一個火花作業,該腳本有一堆env vars和參數傳遞給spark。奇怪的是,驅動程序主機不是這些參數之一(但是有驅動程序核心和內存)。因此,如果我在羣集中有3臺機器,則會隨機選擇一個驅動程序。我不想要這樣的行爲,因爲1)我要提交的jar只在其中一臺機器上,2)驅動程序機器應該比其他機器小,如果它是隨機選擇,情況就不是這樣。指定火花提交的火花驅動程序
到目前爲止,我沒有辦法在命令行上指定這個參數爲spar-submit
。我試過--conf SPARK_DRIVER_HOST="172.30.1.123
,--conf spark.driver.host="172.30.1.123
和許多其他的東西,但沒有任何影響。我正在使用spark 2.1.0。謝謝。
您是否以羣集模式啓動紗線? – FaigB
我使用集羣模式 – Dmitri
任何人都可以點我一個很好的資源解釋火花執行模型?官方文檔只是增加了混淆... – Dmitri