我想從Zeppelin筆記本中讀取位於Amazon S3中的avro文件。我理解Databricks有一個很好的包spark-avro
。爲了將這個jar文件引導到我的集羣並使其工作,我需要採取哪些步驟?引導Amazon EMR集羣的spark-avro jar
當我寫這在我的筆記本上, val df = sqlContext.read.avro("s3n://path_to_avro_files_in_one_bucket/")
我得到下面的錯誤 - <console>:34: error: value avro is not a member of org.apache.spark.sql.DataFrameReader
我有看this。我猜那裏發佈的解決方案不適用於最新版本的Amazon EMR。
如果有人能給我指針,那真的會有所幫助。