1
我對hbase有點新,並且已經能夠設置hbase並查詢存儲在多個hadoop計算機上的數據,但是我想知道是否可以在hbase中分發數據分析以及。hbase數據的分佈式分析
這是我的情況,我有幾十億條記錄需要快速分析,我想讓X服務器查詢數據庫並獲取查詢的獨特部分,以便他們可以使用它而不是使用單個服務器通過整個數據集。這是可能的,我該怎麼做?
我很不確定如何解決這個問題,因爲我意識到所有的查詢都需要協調(每個服務器不能單獨查詢hbase,否則hbase不會知道如何在服務器之間拆分請求)。我很困惑,但是也許有想在hadoop中做到這一點的本地方法?
如果有幫助,我的應用程序運行java,並使用cloudera分佈在EC2上運行集羣。