我想提交一個導入numpy的python文件,但我得到一個no module named numpy
錯誤。火花提交時沒有名爲numpy的模塊
$ spark-submit --py-files projects/other_requirements.egg projects/jobs/my_numpy_als.py
Traceback (most recent call last):
File "/usr/local/www/my_numpy_als.py", line 13, in <module>
from pyspark.mllib.recommendation import ALS
File "/usr/lib/spark/python/pyspark/mllib/__init__.py", line 24, in <module>
import numpy
ImportError: No module named numpy
我在想我會爲numpy -python文件提取一個蛋,但是我很難弄清楚如何生成這個蛋。但後來我發現pyspark本身使用numpy。拉我自己的版本的numpy將是愚蠢的。
任何關於在這裏做適當的事情的想法?
嘗試安裝完整的SciPy或獨立的NumPy包,用於您目前使用的Python二進制文件:http://www.scipy.org/install.html – 2015-10-29 02:56:53