我的使用案例:如何使用shell腳本編寫Sqoop作業
每天小時表在mysql db中被創建。我需要使用Sqoop每天將它們移動到HDFS,並使用Impala處理HDFS數據。
如何編寫一個shell腳本或作業才能將新創建的表數據定期移動到HDFS(現有文件系統)?
今天說的是2016年1月3日,當我今天運行我的工作,然後2016年1月2日的數據應該從mysql遷移到HDFS,就像每天的廣泛它應該移動前一天的數據。 每日我需要在此HDFS集羣上運行我的Impala查詢並生成報告。
如何使用Impala處理整個數據並生成報告?