hive-serde

    1熱度

    1回答

    我想從xml中使用xml serde在Hive中提取時間戳。外部表格創建鏈接到hdfs目錄。目前,時間戳值在我的表中顯示爲空。 我想時間戳需要被鑄造?我不確定。其餘的xml信息工作正常,並顯示在配置單元中。 輸入文件是: <example> <date>2017-02-09 22:03:58<date> </example> 蜂巢創建腳本: create external table ex

    2熱度

    2回答

    是有可能使用RC或ORC文件格式的JSON serde?我試圖插入到具有文件格式ORC的Hive表中,並以序列化的JSON存儲在azure blob上。

    1熱度

    1回答

    我試圖將嵌套的XML數據加載到Hive中。樣本數據如下... <CustomerOrders> <Customers> <CustID>ALFKI</CustID> <Orders> <OrderID>10643</OrderID> <CustomerID>ALFKI</CustomerID> <OrderDate>1997-08-

    1熱度

    1回答

    我有JSON文件要加載到配置單元表,但它包含重複鍵,使所有數據爲空或無法在Hive上選擇查詢。 這些JSON文件有這樣的事情: {"timeSeries":"17051233123","id":"123","timeseries":"17051233123","name":"sample"} 我嘗試創建蜂巢表 CREATE EXTERNAL TABLE table_hive (`id` STRI

    0熱度

    1回答

    我是新來攆,得到了一些東西來解析格式 [Time Stamp] {Complex JSON data} 的日誌。 我可以擴展這些JSON Serde代碼以適合我的需要嗎?如果是的話,哪個JSON serde代碼可以更好地選擇? 如果這種方法不好,還有其他指針嗎? 感謝

    0熱度

    1回答

    我試圖在配置單元中處理多字符delmiter。 我已經創建了一個表,相同的成功 create external table showtmp3(doc_name STRING,doc_content STRING) row format SERDE 'org.apache.hadoop.hive.serde2.MultiDelimitSerDe' WITH SERDEPROPERTIES ('fie

    0熱度

    2回答

    我有S3中包含.orc文件的多個子目錄。我試圖創建一個配置單元Metastore,這樣我就可以使用Presto/Hive等查詢數據。數據結構很差(沒有一致的分隔符,難看的字符等)。這裏有一個擦洗樣本: 1488736466 199.199.199.199 0_b.www.sphericalcow.com.f9b1.qk-g6m6z24tdr.v4.url.name.com TXT IN: NXDO

    -2熱度

    2回答

    我試圖使用DDL在蜂巢 { "id": "0001", "type": "donut", "name": "Cake", "ppu": 0.55, "batters": { "batter": [ { "id": "1001", "type": "Regular" },

    -1熱度

    1回答

    我嘗試運行了這麼長的時間能有人告訴我這段代碼是什麼問題,它 代碼: - CREATE EXTERNAL TABLE samp_log ( ip String ,col1 String ,col2 String , date String , time_hour int ,time_min int ,time_sec int ,zone int , request String , reques

    0熱度

    1回答

    我用SERDE閱讀與分隔符特定格式數據|我的數據 一號線可能看起來像:鍵1 =值2 |鍵2 =值| KEY3 =「VA,梅毒」,我創建蜂巢表如下: CREATE EXTERNAL TABLE( field1 STRING, field2 STRING, field3 STRING ) ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.Regex