hive

1熱度

1回答

我在AWS一個蜂房表名爲table1僅帶有一列，它看起來像圖所示： COL1 (null) active 試圖下面查詢 select * from table1 where COL1 NOT IN ('reversed') 蜂房是返回只有一行 COL1 active 爲什麼它不返回記錄（null）？我知道修正是修改條件如下。但我想調試這個問題，以便這不會對其他查詢 wher

0熱度

1回答

查詢Hive中每個節點的子節點的數量

-2熱度

1回答

需要幫助解決這個SQL查詢來了解

編寫一個SQL生成與給定條件的員工數據集的報告，如果平均年齡> 35則規定值notok數據集 id name age dept salary 1 tt 51 it 4000 2 kk 56 it 6000 3 mm 45 sales 7000 4 kk 25 sales 9000 5 op 24 hr 4000 6 op 24 hr 8000 輸出 dept avgage sta

2熱度

1回答

如何訪問Hive中的現有表？

我想用scala來訪問spark應用程序中的HIVE。我的代碼： val hiveLocation = "hdfs://master:9000/user/hive/warehouse" val conf = new SparkConf().setAppName("SOME APP NAME").setMaster("local[*]").set("spark.sql.warehouse.dir

0熱度

2回答

Hive和SparkSQL不支持日期時間類型？

是不是Hive和SparkSQL不支持datetime的數據類型？從我閱讀的參考文獻中，他們似乎只支持date和timestamp。前者不是時間分量（即小時，分鐘和秒）;後者具有很高的精確度（低至毫秒），但並不是人類可讀的（它總是需要通過from_unixtime()或date_format()進行轉換，結果將是字符串，而不是datetime類型）。相比之下，其他數據庫系統（如MySQL）具有

0熱度

1回答

得到「EsHadoopIllegalArgumentException：索引[汽油/ petrolCat]丟失和設置」，同時從蜂巢到ES的數據編號

有人可以請幫我解決這個錯誤。由於此例外，我無法將Hive數據加載到Elastic Search。 --Hive控制檯代碼 Hive> > create external table petrol_es(distributer_id STRING,distributer_name STRING,amt_IN STRING,amy_OUT STRING,vol_IN INT,vol_OUT

0熱度

2回答

Hive/SparkSQL：如何將Unix時間戳轉換爲時間戳（不是字符串）？

我想這是很容易... 在蜂巢/ SparkSQL，我該如何轉換unix時間戳[注1]爲timestamp 數據類型？（注1：也就是說，自1970年1月1日秒/分的毫秒數）我想from_unixtime()會做到這一點，但它給回一個字符串，而不是一個時間戳。以下實驗說明了該問題步驟0：製備 select from_unixtime(1508673584) as fut; 結果：

0熱度

1回答

星火/斯卡拉加載Oracle表格到Hive

我正在加載幾個Oracle表格到蜂巢，它似乎正在工作，但2表格正在出錯 - IllegalArgumentException: requirement failed: Decimal precision 136 exceeds max precision 38 我檢查了Oracle表格，並沒有與十進制（136）精度的列，在來源中。這裏是spark-shell星火/ Scala代碼： val df

0熱度

1回答

Hive合併小ORC文件

我的輸入包含大量的小ORC文件，我希望在一天的每一天結束，我想將數據拆分爲100MB的塊。我的輸入和輸出都是S3和環境中使用的電子病歷，蜂巢參數，正在設置， set hive.msck.path.validation=ignore; set hive.exec.reducers.bytes.per.reducer=256000000; SET hive.exec.dynamic.parti

0熱度

3回答

Hive Query：定義一個變量，它是一個字符串列表

如何創建一個常量列表並在查詢的WHERE子句中使用它？例如，我有一個蜂巢查詢，在這裏我說 Select t1.Id, t1.symptom from t1 WHERE lower(symptom) NOT IN ('coughing','sneezing','xyz', etc,...) 而是不斷的重複這個漫長的症狀名單（這使得代碼非常難看）的，有沒有辦法提前定義它時間 MY