0
我有當前正在使用的蒙戈-hadoop的橋(從https://github.com/mongodb/mongo-hadoop/blob/master/spark/src/main/python/README.rst)訪問蒙戈數據庫火花過程:連接到蒙戈與副本集和蒙戈-hadoop的連接器,用於火花
mongo_url = 'mongodb://localhost:27017/db_name.collection_name'
mongo_rdd = spark_context.mongoRDD(mongo_url)
蒙戈實例現在正在升級到只能使用副本集訪問的羣集。
如何使用mongo-hadoop連接器創建RDD? mongoRDD()轉到mongoPairRDD(),它可能不需要多個字符串。