在追加模式下將DF插入Hive內表的正確方法是什麼?看來我們可以直接使用「saveAsTable」方法將DF寫入Hive,或者將DF存儲到臨時表中,然後使用查詢。如何將Spark DataFrame插入Hive內部表?
df.write().mode("append").saveAsTable("tableName")
OR
df.registerTempTable("temptable")
sqlContext.sql("CREATE TABLE IF NOT EXISTS mytable as select * from temptable")
將在第二方法追加記錄還是覆蓋它嗎?
是否有任何其他方式有效地將DF寫入Hive內部表?
它取決於(類型)將如何存儲您的表和位置。 – FaigB