我使用的查詢,如下所示,以從MySQL獲取數據:虛列火花JDBC
var df = spark.read.format("jdbc")
.option("url", "jdbc:mysql://10.0.0.192:3306/retail_db")
.option("driver" ,"com.mysql.jdbc.Driver")
.option("user", "retail_dba")
.option("password", "cloudera")
.option("dbtable", "orders")
.option("partitionColumn", "order_id")
.option("lowerBound", "1")
.option("upperBound", "68883")
.option("numPartitions", "4")
.load()
問題是,我可以使用僞柱(像ROWNUM
在Oracle或RRN(employeeno)
在DB2)與option
其中I指定partitionColumn
?
如果不是,我們可以指定一個不是主鍵的分區列嗎?
@clear sky,請標記答案爲已接受,如果它解決您的查詢。 –
請更具體一點 - 它可以是僞列嗎?例如,像Oracle ROWNUM? –
你有沒有嘗試在你的代碼中使用ROWNUM而不是order_id? –