0
目前我們每天都在刪除表格並運行將數據加載到表格的腳本。腳本需要3-4個小時才能獲得數據。因此,我們的目標是在新的數據加載執行完成之前將舊的配置單元數據提供給分析師。通過豬腳本刪除配置表格分區
我通過在load_year,load_month和load_day上分區的hive表格加載每日數據並通過刪除分區來刪除昨天的數據來實現hql腳本中的這件事。 但豬腳的選擇是什麼?我們可以通過豬腳改變桌子嗎?我不想執行另一個hql來分割豬後的分區。 謝謝
豬用於數據流...所以雖然採摘過程PIC正確的數據資料...... –
我很抱歉。我沒有得到你。我的問題與提取數據無關,它與將數據存儲在豬中以及存儲通過豬丟棄舊數據有關。 – Renu