我想用scala來訪問spark應用程序中的HIVE。 我的代碼: val hiveLocation = "hdfs://master:9000/user/hive/warehouse"
val conf = new SparkConf().setAppName("SOME APP NAME").setMaster("local[*]").set("spark.sql.warehouse.dir
我寫一個斯卡拉/火花程序,會發現該僱員的薪水最高。員工數據可以CSV文件形式提供,而薪金列有數千個逗號分隔符,並且還有一個$前綴,例如$ 74,628.00。 爲了解決這個逗號和美元符號,我已經用Scala編寫這將分割每行一個解析器功能「」然後每一列映射到各個變量被分配到一個案例類。 我的解析器程序看起來像下面。爲了消除逗號和美元符號,我使用替換函數將其替換爲空,然後最終將類型轉換爲Int。 de