3
test.csv
name,key1,key2
A,1,2
B,1,3
C,4,3
我想改變這個數據是這樣的(如數據集或RDD)火花 - 與階
whatIwant.csv
name,key,newkeyname
A,1,KEYA
A,2,KEYB
B,1,KEYA
B,3,KEYB
C,4,KEYA
C,3,KEYB
.csv數據分割我與讀取方法加載的數據。
val df = spark.read
.option("header", true)
.option("charset", "euc-kr")
.csv(csvFilePath)
我可以加載每個數據集一樣(名稱,鍵1)或(名稱,密鑰2),以及他們的工會工會,但要做到這一點星星之火會議。 對此有何想法?
那些不工作。
val df2 = df.select(df("TAG_NO"), df.map { x => (x.getAs[String]("MK_VNDRNM"), x.getAs[String]("WK_ORD_DT")) })
val df2 = df.select(df("TAG_NO"), Seq(df("TAG_NO"), df("WK_ORD_DT")))
你嘗試'從數據幀explode'功能? – Shankar
nope。我會嘗試爆炸。謝謝:) –
因爲key1和key2不在單列中,所以我認爲explode並不是正確的答案。 –