druid

    2熱度

    2回答

    我是德魯伊新手。我已經讀過「德魯伊VS Elasticsearch」,但我仍然不知道德魯伊擅長什麼。 下面是我的問題: 我有70個節點的集羣的Solr。 我有一個非常大的solr表中有10億行,每行有100個字段。 用戶將使用字段的不同組合範圍查詢(至少在一個查詢中有20個組合)來計算客戶ID的不同數量,但solr的不同計數算法非常慢並且使用大量內存,所以如果查詢結果超過20萬,solr的查詢節點

    1熱度

    1回答

    我們有一個維度,它將逗號分隔的字符串保存爲值(例如:「t1,t2,t3」),是否有可能將該維度視爲多值維度將它們存儲爲JSON數組? 注:如果一定要糾正和負載爲JSON陣列,全部爲過去6個月的歷史數據必須被固定 感謝, Sathish所在

    0熱度

    1回答

    我正在測試Druid中的批量數據攝取。目前在我的安裝中,有一個文件夾$DRUID/var/tmp,現在增長到近1TB(是TB)。而$DRUID/var/druid僅僅是350GB。刪除那個$DRUID/var/tmp文件夾是否安全?

    2熱度

    1回答

    我有一個很難低於轉換這個簡單的SQL查詢到德魯伊: SELECT country, city, Count(*) FROM people_data WHERE name="Mary" GROUP BY country, city; 所以我想出了這個查詢至今: { "queryType": "groupBy", "dataSource" : "people_data",

    1熱度

    1回答

    我正在研究和查詢德魯伊服務器上的數據。但是,當我查詢我只是用如下的命令行: curl -X 'POST' -H 'Content-Type:application/json' -d @quickstart/ingest_statistic_hourly_generate.json localhost:8090/druid/indexer/v1/task 誰能告訴我使用Java客戶端與Apach

    0熱度

    1回答

    我有廣告日誌數據,我想實時發送給德魯伊服務器。但問題在於寧靜和卡夫卡之間。這是實時攝取數據的最佳方法。因爲,當使用kafka時,它會產生一系列錯誤。我嘗試使用寧靜。 任何有這方面經驗的人都能幫助我嗎?非常感謝。

    -1熱度

    1回答

    這是嵌套問題,請幫忙分析原因 總體代碼結構說明:在一些 TransactionA DB操作,然後打開transactionB。 TransactionA提交時間以觸發自定義觸發,在打開transactionC(PROPAGATION_REQUIRES_NEW)觸發 錯誤的過程是這樣的: 第一次運行是正確的沒有錯誤,第二次運行時間去閉合連接,測試碼是這樣的: @Test public void t

    1熱度

    4回答

    我正在使用德魯伊創建用於生成報告的用戶界面。對於腳本,我使用如下代碼: { "type" : "doubleSum", "name" : "impressions", "fieldName" : "impressions" }, { "type" : "doubleSum", "name" : "clicks",

    2熱度

    1回答

    我是德魯伊的新手。我的問題是如何使用java來存儲和查詢Druid中的HashMap進行交互。 我network table如下: Network f1 f1 f3 .... fn value 1 3 2 ..... 2 另外,我有range-time table time impression 2016-08-10-00 1000 2016-08-10-00 3000

    0熱度

    1回答

    我是Druid的新手。我使用Imply IAP package設置了一個羣集。 使用Tranquility將事件從卡夫卡攝入德魯伊。我可以看到,事件正在由寧靜接受 - 以下日誌語句是我用來驗證: 2016-10-03 19:19:22,715 [KafkaConsumer-CommitThread] INFO c.m.tranquility.kafka.KafkaConsumer - Flushe