我已經編寫了一個使用pyspark連接到oracle數據庫並獲取數據的程序。下面的命令工作正常,並返回表的內容:如何使用pi spark在oracle數據庫上執行select查詢?
sqlContext.read.format("jdbc")
.option("url","jdbc:oracle:thin:user/[email protected]:port/dbname")
.option("dbtable","SCHEMA.TABLE")
.option("driver","oracle.jdbc.driver.OracleDriver")
.load().show()
現在我不想加載整個表的數據。我想加載選定的記錄。我可以指定選擇查詢作爲此命令的一部分嗎?如果是的話如何?
注意:我可以使用數據框並在其頂部執行select查詢,但我不想這樣做。請幫忙!!