This page是鼓勵我嘗試火花CSV在Pyspark 讀取.csv文件,我發現一對夫婦職位如this描述如何使用spark-csv如何加載罐子dependenices在IPython的筆記本
但我的無法通過在啓動時包含.jar文件或包擴展名來初始化ipython實例,這可以通過spark-shell來完成。我試過ipython notebook --profile=pyspark --packages com.databricks:spark-csv_2.10:1.0.3
,但它不被支持。
請指教。
這不會覆蓋已經在'os.environ [「PYSPARK_SUBMIT_ARGS」]'中的所有東西嗎?我認爲這需要提及,因爲我花了很多時間來計算髮生了什麼 –