2015-05-21 170 views
2

當我在Spark python的例子中使用spark run pi.py腳本時,出現了一個問題,當我使用yarn-client模式時,一切正常。但是當我使用的紗線集羣模式,作業無法啓動,並且容器返回語法錯誤是這樣的:在紗線簇模式下運行python spark作業

日誌類型:標準輸出

日誌上傳時間:週四5月21日8時48分16秒+ 0800 2015

LogLength:111項

日誌內容:

文件 「pi.py」,線路40

return 1 if x ** 2 + y ** 2 < 1 else 0 

我確定該腳本是正確的,任何人都可以幫助我。

回答

3

注意到語法錯誤是包含在新版本的python中的特性,所以我意識到也許這是關於python版本的spark使用的問題。

我/etc/spark/conf.cloudera.spark_on_yarn/spark-defaults.conf添加屬性:

spark.yarn.appMasterEnv.PYSPARK_PYTHON

指定蟒蛇二進制路徑。

然後問題解決了。

0

火花目前不支持在集羣模式下運行的Python腳本(部署司機集羣)

另外,如果您的應用程序從一臺機器遠遠 從工人機提交的(例如在本地你的筆記本電腦),通常使用集羣模式 來最小化驅動程序 和執行程序之間的網絡延遲。請注意,Mesos羣集或Python應用程序目前不支持羣集模式 。

https://spark.apache.org/docs/1.3.1/submitting-applications.html

相關問題