2017-01-19 44 views
1

使用數據框時可以定義主鍵嗎? 我有兩個數據框,我加入了「ID」。現在我想選擇「日期」,並在輸出中收到主鍵「ID」。Scala:定義數據框中的主鍵

val join1 = df_2.join(df_3, df_3.col("ID") === df_2.col("APPLICATION2_ID")) 
val joinFinal = join1.join(df_1, df_1.col("ID") === join1.col("ID")) 
+0

DataFrames沒有一個主鍵的概念,你的建議應該工作什麼......你究竟試過了什麼不起作用? –

+0

val join1 = df_2.join(df_3,df_3.col(「ID」)=== df_2.col(「APPLICATION2_ID」)) val joinFinal = join1.join(df_1,df_1.col(「ID」)== = join1.col(「ID」))我有3個數據框,我加入並且所有數據框都有「ID」列。現在我正在嘗試執行轉換。 val df_Move = joinFinal.select(「ID」,「Date」)。但是由於多列稱爲「ID」,我得到了一個模糊的ID錯誤。 – SFatima

+0

@Safama什麼是錯誤? –

回答

2

爲了擺脫重複列時加入對同名的人使用的序列版本:

val joinFinal = join1.join(df_1, Seq("ID"))