-1
我是數據分析/大數據分析的n00b。我目前正在學習統計和R.我想知道學習和使用Apache Drill的知識先決條件,以便我可以優化學習計劃?學習Apache Drill的知識先決條件是什麼?
我是數據分析/大數據分析的n00b。我目前正在學習統計和R.我想知道學習和使用Apache Drill的知識先決條件,以便我可以優化學習計劃?學習Apache Drill的知識先決條件是什麼?
Drill仍處於alpha狀態,文檔非常有限。如果您需要穩定性,Cloudera Impala可能是短期內更好的選擇。
您需要學習兩件事 - 如何將數據導入Drill可以使用的表單以及如何運行查詢。後者很簡單 - 學習SQL。
前者比較複雜。這些非常有限的例子在Twitter的Parquet數據格式中使用本地文件,因此這將是一個很好的開始。對於更實際的(即分佈式)場景,請了解HDFS(Hadoop分佈式文件系統)和Zookeeper,HBase或MongoDB。
警告 - 如果您真的想在真正的大數據環境中使用Drill(您不應該這樣做,因爲它在alpha模式下),您會發現這是一個陡峭的學習曲線,需要大量複雜的信息。打破它一個很好的方法可能是: