按照Spark on Mesos docs一個需要的spark.executor.uri
指向設置爲星火分佈在使用星火時:如何預包裝外部庫一Mesos集羣
val conf = new SparkConf()
.setMaster("mesos://HOST:5050")
.setAppName("My app")
.set("spark.executor.uri", "<path to spark-1.4.1.tar.gz uploaded above>")
該文檔還指出,一個可以建立一個定製Spark發行版本。
我現在的問題是,是否有可能/期望預封裝外部庫如
- 火花流-卡夫卡
- elasticsearch火花
- 火花CSV
這將用於大多數我將通過提交到
的所有工作罐子中使用- 減少時間
sbt assembly
需要打包脂肪罐子 - 減少需要提交
如果是脂肪罐子的大小,如何才能實現這一目標?一般來說,關於如何提高工作提交過程中的胖子生成速度,有一些提示嗎?
背景是我想爲Spark作業運行一些代碼生成,並立即提交併在瀏覽器前端異步顯示結果。前端部分不應該太複雜,但我想知道後端部分是如何實現的。
當你說預包裝你真的是分發到所有的奴隸,併成立了工作使用這些包,這樣你就不需要下載的每一次?這可能是一個選擇,但它聽起來有點麻煩。 – hartem