hbase

    0熱度

    2回答

    我寫了一個擴展爲FilterBase並轉換爲JAR的Hbase自定義過濾器。該過濾器看起來是這樣的: public class MyFilter1 extends FilterBase implements Serializable{ boolean filterRow= true; String srh; public MyFilter1(String str) { this.

    1熱度

    1回答

    我希望能夠在HDFS上存儲數百萬個小文件(二進制文件 - 圖像,exe等)(〜1Mb),我的要求基本上是能夠查詢隨機文件而不是運行MapReduce作業。 我的主要問題是Namenode內存問題,而不是MapReduce映射問題。 所以我的選擇是: HAR文件 - 骨料小文件,只比他們的HAR他們節省://路徑在另一個地方 序列文件 - 添加他們,因爲他們進來,這更適合於MapReduce作業,所

    0熱度

    1回答

    在Zeppelin中運行hbase作業時,遇到問題「error:keepererrorcode = connectionloss for/hbase」。 Hbase版本 - 1.2,用HBase 1.2編譯的Apache Zeppelin 0.8.0。 HBASE在CDH 5.11.0集羣 HBase的命令運行成功地從CLI從同一臺主機上運行,​​但是從齊柏林UI失敗。 Zeppelin主機被配置

    1熱度

    1回答

    我想使用來自Java的CsvBulkLoadTool將csv數據文件放到HBase表中。 HBase和Phoenix正在Ubuntu VM上運行。 當我從Windows中運行CsvBulkLoadTool.run()我得到一個異常: java.lang.IllegalArgumentException: Pathname /C:/Users/My_User/.m2/repository/org/a

    1熱度

    1回答

    我正在開發一個用於從不同來源生成的數據的Hbase存儲。通常來自同一個源的列更可能同時被檢索到。預期的讀寫比率大致在1/10到1/100之間(取決於不同的來源)。 所以有是我兩個選擇: 多列族:只要創建一個表和多個列族,從相同的源數據的每個種類將形成列族。 多個表格:爲每個來源創建一個表格(有一個列族)。 這裏有一些我的理解,請糾正我,如果有任何錯誤。 多表解決方案適用於動態添加新來源。雖然多列家

    0熱度

    1回答

    當我使用ycsb遠程測試hbase時,我得到了衆所周知的警告「java.io.IOException:No FileSystem for scheme:hdfs」但我不知道如何解決這個問題。 誰可以給我一些建議?非常感謝!

    1熱度

    1回答

    我使用hadoop 2.6.0和hbase 0.98.7,我爲hdfs/namenode配置了HA。我正在顯示活動的nn1和待機nn2。現在的問題是我無法爲hbase啓用高可用性,我也不知道如何將hbase與啓用HA的hdfs集成。此外,雖然做jps HMaster正在運行,但無法看到hbase的用戶界面。 我核心的site.xml <configuration> <property> <na

    0熱度

    1回答

    我是HBase的新手,仍然不確定Hadoop生態系統的哪個組件將用於我的案例,以及以後如何分析我的數據以便探索選項。 我有一個Excel工作表與所有這樣的客戶彙總但≈400列: CustomerID Country Age E-mail 251648 Russia 27 [email protected] 487985 USA 30 [email protected] 47894

    1熱度

    1回答

    我開始在單機模式下的動物園管理員的服務,動物園管理員二進制與卡夫卡一起進行。下面是zookeeper.properties dataDir=/tmp/zookeeper clientPort=2181 maxClientCnxns=0 我使用下面的命令開始的動物園管理員的內容。 kafka/bin/zookeeper-server-start.sh config

    0熱度

    1回答

    我想觸發hbase中所有表的主要壓縮。使用hbase客戶端API,通過admin.majorCompact(tableName)觸發所有時間的主要壓縮。 1)如何找出壓縮的完成狀態,因爲hbase client api majorCompact是一個Asynchorous過程。 2)是否必須等到壓實過程完成後,查詢的HBase的實時過程