我使用YARN運行Spark。Spark-submit/spark-shell> yarn-client和yarn-cluster模式之間的區別
從鏈接:http://spark.apache.org/docs/latest/running-on-yarn.html
我發現不同的紗線模式的解釋,即--master選項,與星火可以運行:
「有兩種部署模式,可以使用在紗線羣集模式下,Spark驅動程序在由羣集上的YARN管理的應用程序主進程中運行,客戶端可以在啓動應用程序後離開,在紗線客戶端模式下,驅動程序運行在客戶端進程中,而應用程序主服務器僅用於從YARN請求資源「
在此,我只能理解這個驅動程序在哪裏運行,但我無法理解哪個運行速度更快。 Morevover:
- 在運行星火提交的情況下,--master可以是客戶或集羣
- 相應星火殼的主選項可以紗客戶,但它不支持集羣模式
所以我不知道如何做出選擇,即當使用火花外殼,什麼時候用火花提交,尤其是當使用客戶模式,當使用集羣模式
看看這個[相關答案](http://stackoverflow.com/questions/24909958/spark-on-yarn-concept-understanding/38598830#38598830) – mrsrinivas