我想實現扁平化利用火花/斯卡拉API記錄的邏輯拉平記錄。我正在嘗試使用地圖功能。 能否請你幫我解決這個問題最簡單的方法? 假設,對於一個給定鑰匙我需要有3個過程代碼 輸入數據幀 - > Keycol|processcode
John |1
Mary |8
John |2
John |4
Mary |1
Mary |7
================= =============
我必須使用spark將sql server表中的數據加載到本地文件系統中的csv中。以下是我使用的代碼。 val sqlContext = new org.apache.spark.sql.SQLContext(sc)
val jdbcSqlConnStr = "jdbc:sqlserver://HostIP:1433;databaseName=DBName;user=UserName;pass