我是新來Spark
我試圖訪問Hive
表Spark
如何訪問蜂巢表火花
1)創建星火語境
val hc=new HiveContext(sc)
val hivetable= hc.sql("Select * from test_db.Table")
我的問題是,我得到了表到星火。
1)爲什麼我們需要註冊表?
2)我們可以直接執行SQL operations
仍然爲什麼我們需要Dataframe
功能 像Join, Select, Filter
...等?
是什麼讓SQL Query`和數據幀Operations之間的兩種操作差異
3)什麼是星火優化?它是如何工作的?