2015-10-20 18 views
0

我想通過鑽取嵌入來測試apache鑽取,但是我所有的json文件都是帶有jl.gz文件擴展名的jsonline文件。如何使用不同於默認文件擴展名的鑽取嵌入?

如果我將它們重命名爲json.gz,它可以工作,但這在我的情況下是不可取的。

如何告訴drill jl.gz文件實際上是json?

PS:我試着給$ CP添加一個bootstrap-storage-plugins.json,但是鑽取嵌入似乎沒有讀取它。

回答

0

是的,不要使用引導。這僅適用於分佈式環境,並使用Web Console或REST API is recommended。不用說,gz文件必須壓縮,而不是帶有gz擴展名的解壓縮JSON文件。基於默認的dfs存儲插件創建一個新的存儲插件配置,例如myplugin。

  1. 啓動鑽殼並轉至http://<IP address or host name>:8047。在工具欄中選擇存儲。 dfs storage插件配置出現在默認配置列表中。
  2. 在存儲選項卡的已啓用存儲插件下,單擊更新以複製dfs存儲插件配置。 插件的配置出現。
  3. 複製配置並返回(只需取消配置)。
  4. 在存儲選項卡上,在新建存儲插件中輸入名稱。例如,輸入myplugin。使用Drill註冊的每個配置都必須具有不同的名稱。名稱區分大小寫。
  5. 點擊創建。
  6. 在配置中,在格式部分,更改JSON格式指定擴展: 「GZ」

    「JSON」:{ 「類型」: 「JSON」, 「擴展」:[ 「GZ 「 ] },

  7. 點擊創建。

現在,在鑽外殼,可以查詢指定something.gz JSON文件:

use myplugin; 
select * from `/Users/me/donuts.gz` limit 2; 
+0

謝謝回答它@catpaws。我仍然很新練習。當你談論默認的dfs存儲插件時,你在具體談論什麼文件? –

+0

對不起,添加了一些步驟來讓你的dfs默認存儲插件配置。在嘗試查詢您的json文件之前,可能需要查看http://drill.apache.org/docs/json-data-model/。 – catpaws

相關問題