druid

2熱度

2回答

我是德魯伊新手。我已經讀過「德魯伊VS Elasticsearch」，但我仍然不知道德魯伊擅長什麼。下面是我的問題：我有70個節點的集羣的Solr。我有一個非常大的solr表中有10億行，每行有100個字段。用戶將使用字段的不同組合範圍查詢（至少在一個查詢中有20個組合）來計算客戶ID的不同數量，但solr的不同計數算法非常慢並且使用大量內存，所以如果查詢結果超過20萬，solr的查詢節點

1熱度

1回答

用逗號分隔的字符串上的多值維度

我們有一個維度，它將逗號分隔的字符串保存爲值（例如：「t1，t2，t3」），是否有可能將該維度視爲多值維度將它們存儲爲JSON數組？注：如果一定要糾正和負載爲JSON陣列，全部爲過去6個月的歷史數據必須被固定感謝， Sathish所在

0熱度

1回答

刪除德魯伊的文件夾是否安全var/tmp

我正在測試Druid中的批量數據攝取。目前在我的安裝中，有一個文件夾$DRUID/var/tmp，現在增長到近1TB（是TB）。而$DRUID/var/druid僅僅是350GB。刪除那個$DRUID/var/tmp文件夾是否安全？

2熱度

1回答

如何在從GROUP BY Druid返回的結果中執行SELECT？

我有一個很難低於轉換這個簡單的SQL查詢到德魯伊： SELECT country, city, Count(*) FROM people_data WHERE name="Mary" GROUP BY country, city; 所以我想出了這個查詢至今： { "queryType": "groupBy", "dataSource" : "people_data",

1熱度

1回答

用Apache HttpClient連接到德魯伊的Java客戶端

我正在研究和查詢德魯伊服務器上的數據。但是，當我查詢我只是用如下的命令行： curl -X 'POST' -H 'Content-Type:application/json' -d @quickstart/ingest_statistic_hourly_generate.json localhost:8090/druid/indexer/v1/task 誰能告訴我使用Java客戶端與Apach

0熱度

1回答

將數據流式傳輸到德魯伊服務器

我有廣告日誌數據，我想實時發送給德魯伊服務器。但問題在於寧靜和卡夫卡之間。這是實時攝取數據的最佳方法。因爲，當使用kafka時，它會產生一系列錯誤。我嘗試使用寧靜。任何有這方面經驗的人都能幫助我嗎？非常感謝。

-1熱度

1回答

爲什麼要在已經關閉，導致連接「持有人是空」的錯誤

這是嵌套問題，請幫忙分析原因總體代碼結構說明：在一些 TransactionA DB操作，然後打開transactionB。 TransactionA提交時間以觸發自定義觸發，在打開transactionC（PROPAGATION_REQUIRES_NEW）觸發錯誤的過程是這樣的：第一次運行是正確的沒有錯誤，第二次運行時間去閉合連接，測試碼是這樣的： @Test public void t

1熱度

4回答

德魯伊聚合函數

我正在使用德魯伊創建用於生成報告的用戶界面。對於腳本，我使用如下代碼： { "type" : "doubleSum", "name" : "impressions", "fieldName" : "impressions" }, { "type" : "doubleSum", "name" : "clicks",

2熱度

1回答

在德魯伊存儲HashMap的數據結構

我是德魯伊的新手。我的問題是如何使用java來存儲和查詢Druid中的HashMap進行交互。我network table如下： Network f1 f1 f3 .... fn value 1 3 2 ..... 2 另外，我有range-time table time impression 2016-08-10-00 1000 2016-08-10-00 3000

0熱度

1回答

UnresolvedAddressException被德魯伊經紀人擊中

我是Druid的新手。我使用Imply IAP package設置了一個羣集。使用Tranquility將事件從卡夫卡攝入德魯伊。我可以看到，事件正在由寧靜接受 - 以下日誌語句是我用來驗證： 2016-10-03 19:19:22,715 [KafkaConsumer-CommitThread] INFO c.m.tranquility.kafka.KafkaConsumer - Flushe