mapr

    0熱度

    1回答

    我需要優化GET操作採取MAPR分佈伊娜多線程分佈式環境中的時間 - 1)數據服務在多個JVM的運行。 2)我使用HTablePool(必須堅持客戶端版本不支持ConnectionFactory),而性能分析發現使用connection.getTable()引入了HOTSPOT。 問題- 初始請求需要約1秒(我相信是因爲客戶端沒有緩存資源來定位區域等),所以花了額外的時間。通常響應時間是幾毫秒。

    0熱度

    1回答

    如何獲取以Hbase中特定值結尾的行? 例如,我在我的表 D1|V1 D2|V1 D3|V2 D4|V1 低於rowskeys現在我需要與V1結束所有行。在這個例子中,我應該得到D1,D2和D4。 有一個人可以建議如何在HBase的

    0熱度

    1回答

    我想在spark上執行hive查詢。目前我們正在使用mapreduce作爲執行引擎。請讓我知道spark是否支持在MapR集羣上執行配置單元查詢? 早些時候,我執行的蜂巢查詢與Cloudera的火花引擎。但不知道MapR。

    1熱度

    1回答

    我們有一個MapR羣集,在這個羣集上運行,但現在突然停止,甚至無法在mapr演示羣集上運行。我們正在運行MapR 5.1和Spark 1.6.1。 from pyspark import SparkConf, SparkContext from pyspark import HiveContext from pyspark.sql import DataFrameWriter conf =

    1熱度

    1回答

    如果我們在配置單元中爲表建立索引,將在演練中使用配置單元插件查詢配置單元表時使用索引。 這是因爲我們有配置單元中的分區表,並且分析查詢在where子句中有一個分區和非分區列,所以我們要索引hive中的非分區列。

    2熱度

    1回答

    我上MAPR 5.0上運行的Spark 2.1 我得到以下異常,而在本地模式啓動星火 我的火花默認值(重要的配置) spark.sql.hive.metastore.version 0.13.1 spark.sql.hive.metastore.jars /opt/mapr/lib/maprfs-5.0.0-mapr.jar: /opt/mapr/ha

    0熱度

    1回答

    HiveServer2;蜂巢版本:1.2 我想運行一個查詢,其中包含一個自定義的UDF類(實現GenericUDTF)。 UDF類包含一個樹對象,它用於計算。 當樹很小時,查詢運行正常。 但樹增長時,查詢失敗,出現以下錯誤: org.apache.hive.service.cli.HiveSQLException:處理語句時出錯:FAILED:執行錯誤,從org.apache返回代碼-101 .h

    0熱度

    1回答

    我想在Apache鑽運行一個簡單的查詢: select OTT.Handset, OTT.Handset_OS from datasource.`./OTT_DETAILS_V` as OTT, datasource.`./OS` as D where OTT.Handset_OS like concat('%', D.OS , '%'); 上面的查詢試圖獲取具有OS的instring從所有

    0熱度

    1回答

    我們一直在使用Apache社區提供的標準Hadoop發行版。我們正在努力開發銷售分析解決方案。基於以下文檔 https://wiki.apache.org/hadoop/Distributions%20and%20Commercial%20Support 似乎很多公司爲Hadoop提供不同的發行版和商業支持。在我們的例子中,我們只使用標準(Debian)Hadoop發行版。我們遇到很多問題。 我們

    2熱度

    1回答

    PySpark是否可以爲MapR流工作(兼容)? 任何示例代碼? 我已經試過了,但不斷收到異常 strLoc = '/Path1:Stream1' protocol = 'file://' if (strLoc.startswith('/') or strLoc.startswith('\\')) else '' from pyspark.streaming.kafka import *;