mapr

    0熱度

    1回答

    我正在嘗試訪問配置單元CLI。但是,它無法從以下AccessControl問題開始。 足夠強烈,我能夠查詢來自Hue的配置單元數據而沒有AccessControl問題。但是,配置單元CLI不起作用。 我在MapR羣集上。 任何幫助,非常感謝。 [<user_name>@<edge_node> ~]$ hive SLF4J: Class path contains multiple SLF4J b

    0熱度

    1回答

    我正在./bin/pyspark在打開pyspark外殼,但我得到以下錯誤:搜索 `py4j.protocol.PY4JNetworkError: An error occurred while trying to connect to the Java Server` 約了很多。找不到解決方案。 我應該如何解決這個問題? 感謝,

    1熱度

    1回答

    我正嘗試從MapR DB中將數據提取到數據框中,然後使用鑽取工具在pyspark外殼中進行連接。 這是我做我的pyspark殼: `dataframe_mysql = sqlContext.read.format("jdbc").option("url", "jdbc:drill:zk=localhost:5181/drill/demo_mapr_com-drillbits;schema=dfs;

    0熱度

    2回答

    我試圖導入使用SQOOP從SQL Server數據。但我發現一個奇怪的情況 Sqoop列表的故事才發現表DBO。****,除此之外,Sqoop不能列出 但SQL Server上,我可以看到其他表中列出 List of Tables from the SQOOP command List of Tables from SQL Server

    0熱度

    1回答

    我有一個5節點cluster.I使用pyspark將一個100k csv文件加載到數據幀並執行一些etl操作並將輸出寫入parquet文件。 當我加載數據框時,如何將數據集統一劃分到每個執行器處理20k記錄的所有執行者OS中。

    0熱度

    1回答

    我正在尋找一個解決方案,使用maprstream與彈簧整合。我可以創建流和主題,也可以使用流:主題組合來消費/發佈消息。通過參考link來使用卡夫卡客戶端: 但是使用Spring集成努力消費/發佈消息,並且看不到任何解釋相同的示例程序。有人可以幫助我嗎?

    0熱度

    1回答

    很多天這下面maprclient工具正在我的Windows機器上 突然接到UnsatisfiedLinkError的 一個問題可能是什麼固定在跌破發行 C:\選項\ MAPR-客戶5.2.2.4 \ BIN> maprlogin.bat密碼 - 用戶pimbdu_t Picked up JAVA_TOOL_OPTIONS: -Djava.vendor="Sun Microsystems Inc."

    1熱度

    1回答

    我剛開始學習Hadoop,並且有各種格式的輸入類型。我有幾個程序要研究,我的主要問題是如何確定輸入格式是TextInputFormat還是KeyValueTextInputFormat或其他。 你的幫助是非常讚賞

    0熱度

    2回答

    我不知道它是否是mapr-db json的常見問題。 我使用一個Streamsets目的地,這是一個Mapr-DB json表來推送包含10列的記錄。我確定第一列成爲行鍵。當我去 mapr dbshell find /tmp/my_table 我只看到JSON行密鑰而不是其他列 {"_id":"mykey1"} {"_id":"mykey2"} {"_id":"mykey3"} {"_

    0熱度

    1回答

    准入控制嵌入在每個impalad守護程序中,並通過statestore服務進行通信。 impalad後臺程序確定查詢是立即運行還是查詢排隊。 但是,如果突然的請求流導致更多查詢的運行時間超出預期,則整個Impala內存限制和羣集級別的Linux cgroups機制將成爲防止內存過度分配的硬限制。當查詢達到這些限制時,Impala取消查詢。 這是否意味着Impala資源限制在個別Impala守護程序