2017-08-13 129 views
0

我的操作系統是Ubuntu 16,我的目標是在Jupyter筆記本中爲​​,而無需從安裝Spark的目錄內啓動Jupyter Notebook(通過控制檯)。我findspark試了一下,像這樣從任何目錄下引入Jupyter筆記本導入pyspark

import findspark 
findspark.init("directory_where_I_installed_spark_to") 
import pyspark 

這適用於一個會話,但是當我關閉會話並再次打開筆記本,​​讓我ImportError: No module 'pyspark'。我錯過了什麼?

+0

你必須定義環境變量,看一看這一https://stackoverflow.com/questions/35576621/setting-environment-variables-from-python-code-for-spark –

回答

0

如果您在代碼的第二行之後添加findspark.find()以上的代碼 兩次輸出的結果是什麼?

+0

在這兩種情況下(從推出筆記本Jupyter我的主目錄並從Spark目錄啓動它)我得到相同的輸出,即我安裝Spark的目錄。 – Joe

相關問題