設置Python工作器節點的sys路徑的「正確」方式是什麼?工作節點是否從主服務器「繼承」sys路徑是一個好主意?在工作節點'.bashrc
中設置路徑是否是一個好主意?還是有一些標準的Spark設置方式?爲Spark worker設置Python路徑
2
A
回答
2
設置環境變量(包括PYSPARK_PYTHON
)的標準方式是使用conf/spark-env.sh
文件。 Spark附帶一個模板文件(conf/spark-env.sh.template
),它解釋了最常見的選項。
這是一個正常的bash腳本,所以你可以用同樣的方式,你會與.bashrc
你會發現在Spark Configuration Guide更多細節。
-1
可以通過下面的代碼,你可以改變Python路徑只對當前的工作,這也讓不同的Python路徑驅動程序和執行者:
PYSPARK_DRIVER_PYTHON=/home/user1/anaconda2/bin/python PYSPARK_PYTHON=/usr/local/anaconda2/bin/python pyspark --master ..
-3
我的情況的錯誤是:
運行3210例外:Python的工人中有不同的版本2.6比 驅動2.7,PySpark不能用不同的次要版本
,幫助解決辦法:
export PYSPARK_PYTHON=python2.7
export PYSPARK_DRIVER_PYTHON=python2.7
jupyter notebook
當然,我安裝在本地工人python2.7。
我想我也設置PATH也很重要。
我並不依賴當地工人的設置。該路徑從設置jupyter-notebook的邊緣節點繼承。
相關問題
- 1. 設置我的Python路徑?
- 2. 在Python中設置路徑
- 3. Spark攝入路徑:「Source to Driver to Worker」或「Source to Workers」
- 4. 爲Spark YARN集羣模式設置類路徑的好方法?
- 5. 用python路徑設置python腳本shebang
- 6. 爲sdk設置路徑
- 7. 爲org.jruby.Main設置類路徑?
- 8. Apache Spark Worker Timeout
- 9. 設置路徑
- 10. 如何設置defualt python庫路徑
- 11. 如何設置python安裝路徑?
- 12. 在開發期間設置Python路徑
- 13. python virtualenv設置路徑後不工作
- 14. 在PowerShell中設置Python的路徑?
- 15. 在mac osx中設置python路徑?
- 16. 如何設置Python的路徑
- 17. 使用bash腳本設置python路徑?
- 18. 設置類路徑
- 19. NSPathControl設置路徑
- 20. 設置java路徑
- 21. CATALINA_HOME路徑設置
- 22. 設置tomcat路徑
- 23. 設置新路徑
- 24. 設置SVG路徑
- 25. Java路徑設置
- 26. 在Apache Spark中。如何設置worker/executor的環境變量?
- 27. 如何使用IBM Spark安裝程序設置安裝路徑?
- 28. 設置路徑的位置
- 29. 將cookie的路徑設置爲任意路徑
- 30. 將log4net文件路徑設置爲自定義路徑
大多數人都希望做這樣的事情在spark-env.sh: DIR = 「$(光盤 」$(目錄名稱 「$ {BASH_SOURCE [0]}」)「 && PWD)」 PYTHONPATH = $ PYTHONPATH:$ DIR 它不起作用。如果在某些副作用步驟中將其推送到所有工作節點,可能會有效。 通過pyspark或spark-submit進行此操作的運行方式是什麼? – mathtick
在這裏修正? https://issues.apache.org/jira/browse/SPARK-832但不起作用 – mathtick