使用谷歌Dataproc星火產業集羣,我SBT建組裝罐子可以通過SparkContext訪問卡桑德拉。火花SQL從SBT斯卡拉
然而,當我通過sqlContext嘗試訪問我獲得遠程羣集上沒有發現火花SQL類 - 雖然我相信dataproc集羣應該被供應用於火花SQL。
java.lang.NoClassDefFoundError: org/apache/spark/sql/types/UTF8String$
at org.apache.spark.sql.cassandra.CassandraSQLRow$$anonfun$fromJavaDriverRow$1.apply$mcVI$sp(CassandraSQLRow.scala:50)
at scala.collection.immutable.Range.foreach$mVc$sp(Range.scala
我SBT文件:
libraryDependencies ++= Seq(
"org.apache.spark" %% "spark-core" % "1.5.0" % "provided",
"org.apache.spark" %% "spark-sql" % "1.5.0" % "provided",
"com.datastax.spark" %% "spark-cassandra-connector" % "1.4.0"
)
關閉 「提供的」 關於火花SQL使我在罐子複製的合併地獄。
Thx尋求幫助。
THX附加鏈接了很多@dennis,看起來像答案。 現在試一下,但是1.5.0-M2給出了'io.netty'的彙編重複數據刪除問題。畢竟,我將不得不重新掌握自己的知識......我會很快發佈結果...... – navicore