1
我在HDFS中有2個文件 - 一個是沒有標題的csv文件,一個是列名稱列表。我想知道是否可以將列名分配給其他數據框,而不需要像描述的here那樣輸入它們。Spark重命名數據框列
我正在尋找這樣的事情:
val df = sqlContext.read.format("com.databricks.spark.csv").option("delimiter", "\t").load("/user/training_data.txt")
val header = sqlContext.read.format("com.databricks.spark.csv").option("delimiter", ",").load("/user/col_names.txt")
df.columns(header)
這可能嗎?