我正在寫數據(大約83M記錄)從一個數據幀到postgresql,它有點慢。花2.7小時完成寫入數據庫。Spark寫入到postgres慢
看着執行者,只有一個活動任務運行在一個執行器上。有什麼辦法可以使用Spark中的所有執行程序將寫入並行化爲數據庫?
...
val prop = new Properties()
prop.setProperty("user", DB_USER)
prop.setProperty("password", DB_PASSWORD)
prop.setProperty("driver", "org.postgresql.Driver")
salesReportsDf.write
.mode(SaveMode.Append)
.jdbc(s"jdbc:postgresql://$DB_HOST:$DB_PORT/$DATABASE", REPORTS_TABLE, prop)
感謝
您可以添加代碼的一部分寫入PostGres? –
@ThiagoBaldim剛剛爲此發佈了代碼段,謝謝 –