2016-09-16 105 views
5

我正在運行RHEL 6.7,並設置了Anaconda。 (水蟒4.10)。 Jupyter正在開發OOTB,默認情況下它有Python內核。一切都很華麗,所以我可以在Jupyter中選擇「python notebook」。爲Jupyter(Anaconda)安裝Scala內核(或Spark/Toree)

我現在正在尋找使用Jupyter的Scala。 (它看起來像火星內核 - 現在Toree會工作嗎?)

我見過的每個問題/答案都沒有引用我遇到的問題。

我試圖安裝Toree,並沒有

sudo pip install toree 

和它的工作。但是,再下一步是太

jupyter toree install 

而且錯誤我得到的是:

jupyter toree install 
Traceback (most recent call last): 
    File "/usr/app/anaconda/bin/jupyter-toree", line 7, in <module> 
    from toree.toreeapp import main 
ImportError: No module named toree.toreeapp 

我失蹤了一步?我做錯了什麼?如果我需要提供更多信息,我也會很高興。謝謝!

編輯:在Jupyter中獲得Scala筆記本的標準/最簡單/可靠的方法是什麼? (TL; DR)

回答

0

首先,確保你設置你的shell環境SPARK_HOME變量指向哪裏火花的位置,例如:

export SPARK_HOME=$HOME/Downloads/spark-2.0.0-bin-hadoop2.7 

接下來安裝toree

sudo jupyter toree install --spark_home=$SPARK_HOME 
+1

我不認爲這是隻需要使用,但實際上在Torre上開發......「這意味着您需要在您的機器上本地安裝sbt,jupyter/ipython和其他開發需求。「make release」可能會更好,但即使這也需要Docker –

+1

我認爲OP已經通過github頁面並衝過了需求,所以在這裏我只描述了讓Apache Toree啓動並運行的「最簡單」方式:他問。 – 7kemZmani

+0

我沒有碼頭工人,我不打算只用Toree - 除非當然需要,我當然認爲我看到了沒有碼頭工具的說明,但也許不是。 : https://toree.incubator.apache.org/documentation/user/quick-start,是當我得到問題...錯誤:「ImportError:沒有模塊名稱toree.toreeapp」後運行第二個命令,「jupyter toree install --spark_home =/usr/local/bin/apache-spark /」 – robromo

2

如果你試圖用2.11獲得spark 2.0,你可能會得到奇怪的消息。 您需要更新到最新版本0.2.0 對於Ubuntu 16.04 64bit。我在 https://anaconda.org/hyoon/toree

這對蟒蛇2.7 &你需要暢達包& TGZ文件。如果你不知道怎麼回事,然後就下載TGZ然後

tar zxvf toree-0.2.0.dev1.tar.gz 
pip install -e toree-0.2.0.dev1 

,我更喜歡到:

jupyter toree install --interpreters=Scala --spark_home=/opt/spark --user --kernel_name=apache_toree --interpreters=PySpark,SparkR,Scala,SQL 

將在~/.local/share/jupyter/kernels創建內核(--user是關鍵)

快樂的火花!

0

以下爲我工作(與康達4.2.13):

conda install -c creditx toree 

然後,

jupyter toree install --spark_home=/home/crocefisso/Softs/spark-2.0.0-bin-hadoop2.7 --user 

其中/home/crocefisso/Softs/spark-2.0.0-bin-hadoop2.7是我把星火