**DF1** **DF2** **output_DF**
120 D A 120 null A
120 E B 120 null B
125 F C 120 null C
D 120 D D
E 120 E E
F 120 null F
G 120 null G
H 120 null H
125 null A
125 null B
125 null C
125 null D
125 null E
125 F F
125 null G
125 null H
從數據幀1和數據幀2中需要獲取spark-shell中的最終輸出數據幀。 其中A,B,C,D,E,F採用日期格式(yyyy-MM-dd)& 120,125是有成千上萬個ticket_id的ticket_id列。 我剛剛在這裏提取了一個。如何使用scala獲得此信息
您也可以查看'df.join()'函數和可能''df.na.fill()'。 – Shaido
請您詳細說明一下... !! – maduri
[加入密鑰上的Spark數據幀]的可能重複(https://stackoverflow.com/questions/40343625/joining-spark-dataframes-on-the-key) – Harald