hive

    0熱度

    1回答

    我在配置單元中創建了一個UDAF,它將返回列中的第一個重複數字。 表:firstrepeatingnumber,柱:INDATA,數據: 55 125 1561234 123 12 1 -123 321 124 55 123 15236 32 125 44 UDAF:practise.FirstRepeatingNumber UDAF: package practi

    1熱度

    1回答

    的一個月,我有三列起始日期,部門,Tripduration(startdate列在 「MM/DD/YYYY」 需要轉換 「YYYY-MM-DD」) 的要求是對數據進行查詢每個月&由部門 任何幫助分組,將不勝感激?

    0熱度

    1回答

    要求是從日期字段獲取星期幾,日期字段爲「MM/dd/yyyy」,需要轉換爲「yyyy-MM-dd」 我認爲日期轉換可以用UNIX_TIMESTAMP 做,但我怎麼從修改日期字段獲取星期幾? 在這方面的任何幫助將是非常有用

    0熱度

    1回答

    在使用AWS Data Pipeline運行一個Hive Activity,我的蜂巢活動未能與以下錯誤: Diagnostics: Container [pid=,containerID=] is running beyond physical memory limits. Current usage: 1.0 GB of 1 GB physical memory used; 2.8 GB o

    0熱度

    2回答

    我有一個分區和羣集配置單元表(使用蜂巢1.2): hive> describe formatted myClusteredTable; # col_name data_type utc_timestamp timestamp ... clusteredId bigint # Partition Information # col_name data_typ

    0熱度

    1回答

    「NULL」我有一個包含一串與相關數據(用戶,位置等)的鳴叫上亞馬遜DynamoDB。我通過管道輸出了這個,並得到了一個json文件。 其導出爲CSV文件將是一個糟糕的主意,因爲許多鳴叫包含在文本字段中的逗號。隨着新的蜂巢,因爲我,我至少知道,加載JSON文件,我需要某種形式的SERDE。 這是我如何創建表: create external table tablename ( id string,

    0熱度

    1回答

    我試圖使用Oozie Java動作來讀取Hive表,並且作業失敗,錯誤: 「java.io.IOException:NoSuchObjectException(message:sampleDB。測試表未找到)」 該表確實存在,如果我本身執行JAR,它完成罰款和做沒有問題蜂巢連接。 Oozie的一步: <action name="sample-step"> <java> <jo

    0熱度

    1回答

    我正在使用下面的查詢來獲取數據。 select t2.tailnum, t2.year, avg(t1.ddelay) from otp_data t1 left outer join plane_data t2 on trim(t1.tn) = trim(t2.tailnum) group by t2.tailnum; 但收到以下錯誤: FAILED: SemanticException [

    1熱度

    1回答

    我已經把hive-site.xml我spark/conf目錄,並配置它連接到thrift://<user>:9083,我沒有使用derby我mysql-connector-jar內蜂箱/ lib文件夾,還是每次我創建蜂巢表和存儲數據的時候,所有的數據都存儲在metastore_db在我的項目目錄而不是我的hdfs://<user>:9000/user/hive/warehouse,所以如果我刪除m

    0熱度

    1回答

    我試圖首次安裝和配置配置單元與mongo-hadoop-core 2.0.2。我已經安裝了hadoop 2.8.0,Hive 2.1.1和MongoDB 3.4.6。並且單獨運行時一切正常。 我的問題是,我無法將MongoDB與Hive連接。如上所述,我正在使用mongo-Hadoop連接器https://github.com/mongodb/mongo-hadoop/wiki/Hive-Usag