3
我可以從安裝apache spark的同一集羣中的hive服務器加載數據。但是,我怎麼能從遠程配置單元服務器加載數據到數據幀。配置單元jdbc連接器是唯一的選擇嗎?遠程連接apache spark與apache配置單元。
任何建議我該怎麼做?
我可以從安裝apache spark的同一集羣中的hive服務器加載數據。但是,我怎麼能從遠程配置單元服務器加載數據到數據幀。配置單元jdbc連接器是唯一的選擇嗎?遠程連接apache spark與apache配置單元。
任何建議我該怎麼做?
您可以使用org.apache.spark.sql.hive.HiveContext
在Hive表上執行SQL查詢。
您也可以將spark連接到真正存儲數據的底層HDFS目錄。這將更具性能,因爲SQL查詢不需要解析或者將模式應用於文件。
如果羣集是外部一個,you'll need to set hive.metastore.uris
重複:https://stackoverflow.com/questions/31980584/how-to-connect-to-a-hive-metastore-programmatically-in-sparksql –