我的操作系統是Ubuntu 16,我的目標是在Jupyter筆記本中爲,而無需從安裝Spark的目錄內啓動Jupyter Notebook(通過控制檯)。我findspark
試了一下,像這樣從任何目錄下引入Jupyter筆記本導入pyspark
import findspark
findspark.init("directory_where_I_installed_spark_to")
import pyspark
這適用於一個會話,但是當我關閉會話並再次打開筆記本,讓我ImportError: No module 'pyspark'
。我錯過了什麼?
你必須定義環境變量,看一看這一https://stackoverflow.com/questions/35576621/setting-environment-variables-from-python-code-for-spark –