我可以直接考慮類似於源(Teradata)表中存在的分區列的Hive分區列嗎?或者我是否考慮過其他參數來決定Hive分區列?請幫忙。我可以直接考慮類似於源(Teradata)表中存在的分區列的Hive分區列嗎?
0
A
回答
1
這不是最佳實踐。如果以這種方式創建數據,那麼試圖直接訪問HDFS數據的人將無法在每個分區中找到「分區列」。例如,說Teradata表被date
列分區,然後如果hive表也被date
分區,那麼HDFS分區表示2016-08-06將不具有日期字段。所以爲了方便最終用戶對虛擬列進行分區,例如date_d
,它將與日期列的值完全相同。
0
抽象地,在Teradata和蜂巢分區是similar.To開始 與你可能在你的源使用相同的列到 分區表。
如果你的數據的大小在每個單個分區巨大的,再考慮進一步 它分區,以提高performance.The多 分區將主要取決於過濾器的數量,你在你的查詢申請 。
相關問題
- 1. 我可以區分Hive中的每一列嗎?
- 2. 配置單元第一列要在分區表中考慮
- 3. Hive分區和現有表的分區
- 4. 在Hive中。我可以分區(my_partition = some_function())嗎?
- 5. 刪除HIVE中的一系列分區
- 6. 我可以設置kdb分區表的列屬性嗎?
- 7. 你可以更改Hive表的動態分區的格式嗎?
- 8. Hive:需要指定分區列,因爲目標表已分區
- 9. 在HIVE中從HIVE管理的分區表中插入ORC分區表
- 10. Oracle 10g分區:我可以分區一個子表嗎?
- 11. 列表切片和直接分配列表之間的區別?
- 12. 表上的Hive分區
- 13. 計算列上的Hive分區修剪
- 14. Hive Table分區,中間有列
- 15. 分區給定的總的分區和分區數的列表
- 16. 我可以使用java api修改Hive分區位置嗎?
- 17. nodejs中的列表分區
- 18. 更改基於列表的分區的分區鍵
- 19. Spark-Hive分區
- 20. 在HIVE中,分區列不是基礎保存數據的一部分?
- 21. Hadoop/Hive中是否有類似Oracle的分區?
- 22. Sqoop導出分區Hive表
- 23. 分區MySQL表列
- 24. 區分數據源中的列
- 25. 分區表中的Hive加載
- 26. Sqoop - 基於oracle分區表架構創建空的hive分區表
- 27. 根據剩餘空間自動調整分區大小(考慮以下分區)
- 28. 在Hive中加入分區表
- 29. 列表框的分區?
- 30. Haskell列表的所有可能分區