hive

    0熱度

    1回答

    我需要實現一個用例,我需要用來自任何源系統的hdfs文件夾中的最新文件更新配置單元表。我沒有在這裏使用sqoop。 我應該定期從源系統接收更新的文件到特定的HDFS位置(比如/tmp/emp.csv)。我已經在配置單元中創建了託管/內部表,並且第一次手動將數據加載到該表中。 因此,我的最新員工表(在配置單元中創建,倉庫位於默認位置 -/user/hive/warehouse)將擁有emp.csv文

    0熱度

    3回答

    hive>LOAD DATA INPATH '/hadoop/abc/POC2_Setup/input/warr2_claims_5441F.csv' OVERWRITE INTO TABLE baumuster_pre_analysi_text; 失敗:1:17 SemanticException線的路徑無效 '/hadoop/abc/POC2_Setup/input/warr2_claim

    1熱度

    1回答

    美好的一天,我打算創建一個表,但出現錯誤。 我的代碼: CREATE TABLE weblogs( host STRING, identity STRING, customer STRING, time STRING, request STRING, status STRING, size STRING, referer

    1熱度

    1回答

    我想在nano表中使用當前時間戳在nano秒中創建一列。我怎麼能在插入數據時做到這一點?

    0熱度

    1回答

    我有一張11千兆位數據的表,另一位有130千兆數據,我正在執行更新操作,我可以在配置單元中使用映射連接來改進查詢執行優化嗎?請提供有關這方面的有用信息。

    0熱度

    1回答

    HDFS存儲結構化的&非結構化數據。熱線& IMPALA使我們能夠編寫SQL查詢,然後將其轉換爲MapReduce。用戶如何瞭解存儲數據的模式或者如何根據存儲的數據形成這些表格?

    1熱度

    2回答

    我試圖在Hive中創建一個外部表,並使用存儲在Avro格式的Google存儲中的相同數據在BigQuery中創建另一個表。 我使用的是Dataproc集羣星火2.2.0,星火的Avro 4.0.0和2.1.1蜂房 有Avro的版本/包之間的差異一樣,但如果我創建使用蜂巢表和然後我使用Spark編寫文件,我可以在Hive中看到它們。 但是對於BigQuery是不同的,它能夠讀取Hive Avro文件

    0熱度

    1回答

    我試圖實現服務器端分頁。數據庫光標看起來像是一個很好的方法。 Impala是否支持像關係數據庫那樣的database cursors?該文件沒有明確提及它是否存在。

    0熱度

    1回答

    如何執行echo & if .hql(hive)文件中的其他內容? 我能夠執行回聲像下面: !echo "test"; 但是不能像下面的執行「的if-else」。 !if [ 1=1] then !echo "if is working" !else !echo "not working" !fi 謝謝

    0熱度

    1回答

    與此問題類似:Is there a way to toggle expanded table formatting mode in PrestoDB cli?。 有沒有辦法在HIVE中啓用擴展表格格式化模式?在開始一個大型查詢工作之前,我想在寬表中檢查幾條記錄。 複製從另一個問題的例子: 擴展表格格式之前: select * from sometable; id | time | human