我正在運行scala版本2.12.1。使用IntelliJ,我如何使用spark連接到本地postgresql數據庫並運行sql命令來操作表?我有很多關於版本衝突的問題,那麼是否也可以包含依賴關係?使用Spark和Scala連接到本地postgresql數據庫
1
A
回答
1
我建議你使用最新的火花,即2.2.0。對於你想做的事情,你需要spark-core,spark-sql和postgresql jdbc驅動依賴。
火花使用這兩個:
https://mvnrepository.com/artifact/org.apache.spark/spark-core_2.11/2.2.0 https://mvnrepository.com/artifact/org.apache.spark/spark-sql_2.11/2.2.0
對於PostgreSQL驅動這一塊可能會做得很好:
https://mvnrepository.com/artifact/org.postgresql/postgresql/9.4.1212
星火可以連接到通過JDBC的關係型數據庫,有在這個節火花文檔:https://spark.apache.org/docs/latest/sql-programming-guide.html#jdbc-to-other-databases
來自同一文檔:
// Loading data from a JDBC source
val jdbcDF = spark.read
.format("jdbc")
.option("url", "jdbc:postgresql:dbserver")
.option("dbtable", "schema.tablename")
.option("user", "username")
.option("password", "password")
.load()
很明顯,你將需要使用指定你的數據庫的URL,PostgreSQL的連接網址看到https://jdbc.postgresql.org/documentation/80/connect.html
相關問題
- 1. scala lift postgresql的數據庫連接
- 2. 連接到postgresql數據庫
- 3. 如何使用Ruby安全地連接到PostgreSQL數據庫?
- 4. 使用sqlalchemy連接到本地postgresql
- 5. pgbouncer無法連接到本地postgresql數據庫(超時)
- 6. MongoDB Spark連接器:mongo-spark無法連接到數據庫
- 7. 從Spark/pyspark連接到PostgreSQL
- 8. 與Scala玩框架,無法連接到數據庫JDBC Postgresql
- 9. 如何連接到scala中的postgreSQL數據庫?
- 10. 本地數據庫連接
- 11. 連接到本地數據庫
- 12. 本地連接到HerokuConnect Postgres數據庫
- 13. 連接到本地主機數據庫
- 14. 無法連接到本地數據庫
- 15. Sql - 未連接到本地數據庫
- 16. ASP.NET未連接到本地數據庫
- 17. mongodb本地連接到vps數據庫
- 18. 無法連接到本地數據庫
- 19. rails postgresql數據庫連接
- 20. 將R連接到PostgreSQL數據庫
- 21. 連接到Heroku PostgreSQL數據庫
- 22. 如何連接vb6到postgresql數據庫?
- 23. 將PostgreSQL數據庫連接到Sails.js
- 24. 連接到其他數據庫postgresql JDBC
- 25. 連接PGAdmin3到OpenShift PostgreSQL數據庫
- 26. 無法用我創建的用戶連接到本地Postgresql數據庫
- 27. 從本地用戶和glassfish併發連接到Mysql數據庫
- 28. Apache Spark DataFrames連接失敗,使用scala
- 29. 用wamp連接本地數據庫
- 30. 使用java將oracle數據庫連接到apache spark的錯誤
它得到的錯誤:錯誤:(11,24)對象讀不包org.apache成員.spark val jdbcDF = spark.read – squad21
代碼片段中的'spark'引用SparkSession對象,它有一個名爲read的方法。 – oh54