2016-01-18 45 views
3

我真的使用Sprak 1.2.1 spark-cassandra-connector是joinWithCassandraTable()懶嗎?

//join with cassandra 
val rdd = some_array.map(x => SomeClass(x._1,x._2)).joinWithCassandraTable(keyspace, some_table) 
println(timer, "Join") 

//get only the jsons and create rdd temp table 
val jsons = rdd.map(_._2.getString("this")) 
val jsonSchemaRDD = sqlContext.jsonRDD(jsons) 
jsonSchemaRDD.registerTempTable("this_json") 
println(timer, "Map") 

輸出是:

Timer "Join"- 558 ms 
Timer "Map"- 290284 ms 

我猜 「joinWithCassandraTable()」 函數是懶惰的,如果是這樣,什麼是火了向上?

+0

這是Spark的一個非常舊的版本! –

+0

是的,我需要升級dse版本。 – Rada

回答