apache-kudu

    0熱度

    1回答

    當我嘗試安裝kudu時,我得到此錯誤。我找不到任何信息來解決這個問題,唯一能找到的就是在安裝Xcode後問題解決了,但我已經安裝了Xcode。 /kudu/thirdparty/src/llvm-3.9.0.src/projects/compiler-rt/lib/builtins/eprintf.c:14:10: fatal error: 'stdio.h' file not found #i

    0熱度

    1回答

    我試圖用PySpark 2.1.0 >>> from os.path import expanduser, join, abspath >>> from pyspark.sql import SparkSession >>> from pyspark.sql import Row >>> spark = SparkSession.builder \ .master("local"

    -1熱度

    1回答

    我試圖執行一個查詢,該函數的功能類似於lead .. over ..分區和Union。當我試圖在impala上運行它時,此查詢效果很好,但在Hive上失敗。 我需要編寫一個執行此查詢星火工作。它在SparkSQL中也失敗了,我的假設是因爲Spark 1.6在內部使用HiveQL來完成上述任務。 有一些不同的方式來讀取SparkSQL黑斑羚表?因爲在Hive中工作的基本查詢和Both都可以很好地與S

    0熱度

    1回答

    Master和tserver標誌可以從kudu網頁界面訪問(通過defult http://127.0.0.1:8051/varz和http://127.0.0.1:8050/varz)。 但我找不到從命令行獲取它的方法。 例如,如何從正在運行的kudu-tserver實例獲取tserver_master_addrs? 喜歡的東西: kudu-tserver show tserver_master

    0熱度

    1回答

    是否可以在Apache Kudu中可視化數據?有什麼指導方針嗎?

    0熱度

    1回答

    我有一個hive table,它是2.7 MB(以鑲木地板格式存儲)。當我使用impala-shell將此配置表格轉換爲kudu時,我注意到/tserver/文件夾大小增加了大約300 MB。在進一步探索之後,我發現它是/tserver/wals/文件夾,它佔據了這一增長的大部分。由於這個,我面臨嚴重的問題。如果一個2.7 MB的文件生成一個300 MB的WAL,那麼我無法真正處理更大的數據。有針

    1熱度

    4回答

    我目前擁有一個處理大量交易的MySQL數據庫。爲了簡單起見,這是一個實時進行的操作(點擊和其他事件)的數據流。結構是這樣的,用戶屬於子分支機構和分支機構屬於分支機構。 我需要保持點擊的平衡。爲了簡單起見,假設我需要將用戶,子關聯公司和關聯公司的點擊餘額增加1(實際上有更多的處理取決於事件)。目前我很簡單地做到這一點 - 一旦我收到事件,我會在PHP中進行順序查詢 - 我讀取用戶的餘額,遞增1並存儲

    0熱度

    1回答

    我們更改了我們的Apache KUDU的配置。我們已經增加了2個新的kudu大師到原來的。 問題:當我們開始KUDU時,它開始將舊的領導者(原始主),現在一切正常。但過了一段時間,領導者就變成了其中一位主人,所有查詢都開始失敗。 > I0726 16:47:11.372854 99507 consensus_queue.cc:695] T > 00000000000000000000000000

    0熱度

    1回答

    我是Apache Kudu的新手,我將它安裝在我的Ubuntu系統上,後來使用Apache Spark shell在其中創建了一個表。現在,我想插入使用insertRows數據轉換成表()爲我使用的,但下面給出命令, kuduContext.insertRows(customersDF, "spark_kudu_tbl") 凡customersDF是數據幀和spark_kudu_tbl是在捻數

    1熱度

    1回答

    如何將文本文件加載到Apache Kudu表中? 源文件是否需要先在HDFS空間中? 如果不共享相同的HDFS空間,其他的Hadoop生態系統的程序(即/蜂巢,黑斑羚),是有阿帕奇捻等價的: hdfs dfs -put /path/to/file 之前,我嘗試加載該文件?