我想pyspark本(上Databricks運行)連接到MongoDB中:PySpark的MongoDB/java.lang.NoClassDefFoundError:組織/阿帕奇/火花/ SQL /數據幀
from pyspark import SparkConf, SparkContext
from pyspark.mllib.recommendation import ALS
from pyspark.sql import SQLContext
df = spark.read.format("com.mongodb.spark.sql.DefaultSource").load()
,但我得到這個錯誤
java.lang.NoClassDefFoundError:組織/阿帕奇/火花/ SQL /數據幀
我使用火花2.0和蒙戈-火花連接器2.11和定義spark.mongodb.input.uri和spark.mongodb.output .uri
其實我使用Databricks和我已經有火花定義,我得到「<在0x7f25ac1ad6d0 pyspark.sql.session.SparkSession對象>」當我運行打印火花 – Pierre