的spark documentation展示瞭如何可以添加火花包:如何在DSX上將Spark包添加到Spark R筆記本上?
sparkR.session(sparkPackages = "com.databricks:spark-avro_2.11:3.0.0")
我相信初始化會話時,這隻能使用。
如何在DSX上使用筆記本電腦爲SparkR添加Spark包?
的spark documentation展示瞭如何可以添加火花包:如何在DSX上將Spark包添加到Spark R筆記本上?
sparkR.session(sparkPackages = "com.databricks:spark-avro_2.11:3.0.0")
我相信初始化會話時,這隻能使用。
如何在DSX上使用筆記本電腦爲SparkR添加Spark包?
請使用pixiedust包管理器來安裝avro軟件包。因爲濾鏡PixieDust是在Python導入的蟒蛇1.6內核
pixiedust.installPackage("com.databricks:spark-avro_2.11:3.0.0")
http://datascience.ibm.com/docs/content/analyze-data/Package-Manager.html
安裝它。(記住,這是安裝在你的火花實例級別)。 一旦安裝後,重新啓動內核,然後切換至R內核,然後讀這樣的Avro公司: -
df1 <- read.df("episodes.avro", source = "com.databricks.spark.avro", header = "true")
head(df1)
齊全的筆記本: -
https://github.com/charles2588/bluemixsparknotebooks/raw/master/R/sparkRPackageTest.ipynb
謝謝, Charles。