3
我試圖使用Stratio的Spark-MongoDB library來查詢MongoDB集合。我跟着this線程上手和我目前正在運行下面的代碼:使用Stratio的Spark-MongoDB庫的MongoDB查詢過濾器
reader = sqlContext.read.format("com.stratio.datasource.mongodb")
data = reader.options(host='<ip>:27017', database='<db>', collection='<col>').load()
這將在整個集合加載到星火數據框和收集是大的,這是一個採取了大量的時間。有什麼方法可以指定查詢過濾器並只將選定的數據加載到Spark中?