我無法弄清楚如何使用Spark SQL將數據插入Hive表的靜態分區。我可以使用這樣的代碼寫入動態分區:使用Spark SQL將數據插入到靜態Hive分區中
df.write.partitionBy("key").insertInto("my_table")
但是,我想不出如何將數據插入到靜態分區。這意味着,我想定義整個DataFrame應該被寫入的分區,而不需要將列添加到DataFrame。
我看到在 InsertIntoHiveTable類中提到的靜態分區,所以我想它是支持的。有沒有公共的API來做我想要的?
是你能夠找到類似於任何API寫入動態分區? – Explorer
不,我無法找到任何東西,最終將RRD註冊爲臨時表並從中運行SQL INSERT。但是很多Hive代碼已經在Spark 2.0中重寫了,所以現在可能是可行的。 –