0
我是新來蜂巢。我有按日期存儲在文件夾中的日誌:logs/2016/02/15/log-xxx.json
。我想對最後一天的日誌進行日常分析。我不想在最後2-3個文件夾上運行hiveQL(時區差異)。如何有效地做到這一點?配置單元:固定的日誌結構和日常分析
- 我不能告訴配置單元自動發現新日誌並將它們添加爲新分區,對嗎?
- 我必須在每個查詢之前創建外部表並稍後刪除它嗎?
- 有沒有什麼辦法告訴配置單元只在指定的文件夾上運行查詢而不創建任何表?
但文件夾結構是固定且只讀的。我不想在每次分析前複製千兆字節。我可以添加一個任意的現有目錄作爲分區嗎? – piotrek
東西像 ALTER TABLE測試ADD PARTITION(dt ='2014-03-05')location/user/admin/log/2014/3/5' 應該工作 – Viktor