2013-11-09 59 views

回答

2

Drill仍處於alpha狀態,文檔非常有限。如果您需要穩定性,Cloudera Impala可能是短期內更好的選擇。

您需要學習兩件事 - 如何將數據導入Drill可以使用的表單以及如何運行查詢。後者很簡單 - 學習SQL。

前者比較複雜。這些非常有限的例子在Twitter的Parquet數據格式中使用本地文件,因此這將是一個很好的開始。對於更實際的(即分佈式)場景,請了解HDFS(Hadoop分佈式文件系統)和Zookeeper,HBase或MongoDB。

警告 - 如果您真的想在真正的大數據環境中使用Drill(您不應該這樣做,因爲它在alpha模式下),您會發現這是一個陡峭的學習曲線,需要大量複雜的信息。打破它一個很好的方法可能是:

  • SQL - 嘗試SQLite的
  • NoSQL數據庫 - MongoDB的
  • 分佈式文件系統 - HDFS
  • 管理分佈式環境 - 動物園管理員
  • 分佈式鍵值存儲 - HBase
  • 實時分佈式查詢 - 鑽取或Impala。