0
剛剛開始使用Apache spark。拿到了Databricks安裝程序。 正在努力上傳CSV & TAR文件。上傳或下載,將tar文件解壓到數據塊Spark
val publicPCD = sqlContext
.read.format("com.databricks.spark.csv")
.option("header", "true")
.option("inferSchema", "true")
.load("s3-us-west-1.amazonaws.com/db007/Postcode+Data+for+Consumers+FINAL2.csv")
結果:
錯誤:org.apache.hadoop.mapred.InvalidInputException:輸入路徑不存在:/s3-us-west-1.amazonaws.com/db007/Postcode + Data + for + Consumers + FINAL2.csv
理想情況是下載TAR文件,提取CSV文件並進行一些分析。 看看這個文檔沒有任何運氣https://dbc-272bf360-dc36.cloud.databricks.com/#notebook/10137 https://dbc-272bf360-dc36.cloud.databricks.com/#notebook/10758
任何幫助表示讚賞。
佈局和格式,我的朋友,佈局和格式! –