如何重命名列名我有一個數據幀與配置的列名,例如火花SQL
Journey channelA channelB channelC
j1 1 0 0
j1 0 1 0
j1 1 0 0
j2 0 0 1
j2 0 1 0
通過配置我的意思可能是「否」的數據幀通道。
現在我需要在我需要找到的所有通道的東西的總和一樣
df.groupBy("Journey").agg(sum("channelA"), sum("channelB"), sum("channelC"))
轉換其輸出是:
Journey sum(channelA) sum(channelB) sum(channelC)
j1 2 1 0
j2 0 1 1
現在我想重新命名列名到原來的名字,我可以這樣做
.withColumnRenamed("sum(channelA)", channelA)
但正如我所提到的渠道列表是可配置的,我想一個通用列命名語句來命名我所有的都概括列原來的列名,以獲得預期的數據幀爲:
Journey channelA channelB channelC
j1 2 1 0
j2 0 1 1
任何建議如何處理這個