impala

    1熱度

    1回答

    我有一張包含超過3M記錄的表格。 其中一個屬性有時包括英文字母和數字(包括它們之間的空格和 - )等符號,有時還包含其他值,例如中文,俄文字母,空格,特殊字符等不同的語言。 我會保留每個屬性值與英文字母和數字一樣,包括它們之間的負號或合法字符。對於特殊字符和非英語(以及空格) - 我想將它們轉換成相同的值,例如中文中所有相同的名稱都將轉換爲SC1(特殊字符1),接下來的特殊字符將轉換爲SC2等等。

    0熱度

    1回答

    我在黑斑羚(TBL1)中有一個表格,其中包含具有不同數量的第一個普通字母的不同名稱。該表包含約3M記錄。我想添加一個新的屬性到表中,其中每個常見的第一個字母將有一個類。這與DENSE_RANK工作方式相同,但是具有動態數量的第一個字母。相同的第一個字母的數量不應少於p=3字母(p =參數)。 這裏是表和所要求的結果的例子: | ID | Attr1 | New_Attr1 | Some more

    1熱度

    3回答

    我創建了一個擴展DriverManagerDataSource的類SecureImpalaDataSource,並使用UserGroupInformation.doAs()通過keytab文件獲取與impala的連接。但我得到的錯誤如下: 值java.sql.SQLException:[辛巴] ImpalaJDBCDriver錯誤 初始化或進行身份驗證創建交通: [辛巴] ImpalaJDBCDr

    1熱度

    1回答

    select a.time, b.name, c.user_city, case when c.user_country='xxxx' and c.user_state in (select cast(state_id as string) from states_list) then (select d.STATE_NAME from States_LIST d wher

    0熱度

    1回答

    (SELECT CONCAT('ABCDE',SUM((SELECT MAX(id) FROM optigo_data.admin_userdetails LIMIT 1)+1))) 上面是在Mysql中工作,但它不在Impala/Hive中工作,請幫助我。 Error: sub query is not supported.

    0熱度

    1回答

    INSERT INTO admin_userhistroy(sno,UserDetails_ID,UserMessage,SystemMessage_ID,insdate,STATUS,UserDetails_MsgTo_ID,License_Status) VALUES ('1',(SELECT DISTINCT id FROM admin_userdetails WHERE token =

    1熱度

    1回答

    所以問題的基本前提是我在hadoop中有一些巨大的表格,我需要從每個月獲取一些樣本。我嘲笑了下方顯示排序後,我的事情,但顯然它不是真實的數據... --Create the table CREATE TABLE exp_dqss_team.testranking ( Name STRING, Age INT, Favourite_Cheese STRING ) ST

    -2熱度

    1回答

    與Sas和Impala創建表我無法導入包含多列(超過1500)的數據。表已創建,但數據未寫入,並且生成以下錯誤: 錯誤:CLI執行錯誤:[Cloudera] [ImpalaODBC](110)在Impala中執行查詢時出錯: [HY000]:AnalysisException :第1行中的語法錯誤:... , xxx`)VALUES(?,?,?,?,?,?,?,... ^遇到:意外字符預期:CAS

    0熱度

    1回答

    我有一個巨大的表作爲實木複合地板存儲,我需要根據條件添加列。 有沒有辦法做到這一點,而無需在Hive或Impala中重新創建新表格? 這樣的事情? ALTER TABLE xyz ADD COLUMN flag AS (CASE WHEN ... END) 謝謝

    0熱度

    1回答

    當我執行在黑斑羚一個SQL,我得到這個信息: 無法處理一行比IO尺寸更大(row_size = 13.42 MB,null_indicators_size = 0) 。要運行此查詢,請增加IO大小(--read_size選項)。 的解釋是如下: 06:SORT | order by: count(*) DESC | hosts=1 per-host-mem=unavailable | tup