0
如何確定在創建新表時應創建多少桶?選擇配置單元桶數
我碰到下面的答案,
桶=(X * Average_partition_size)/ JVM_memory_available_to_your_Hadoop_tasknode
但是,當你有一個分區表此解決方案纔有效。我的表沒有任何分區,它應該只包含沒有分區的桶?
問候, Prabu
如何確定在創建新表時應創建多少桶?選擇配置單元桶數
我碰到下面的答案,
桶=(X * Average_partition_size)/ JVM_memory_available_to_your_Hadoop_tasknode
但是,當你有一個分區表此解決方案纔有效。我的表沒有任何分區,它應該只包含沒有分區的桶?
問候, Prabu
只要使用表的大小,而不是平均分區大小。該公式基於INSERT作業中的數據量:如果是分區表,則每個分區只有一個分區,但在非分區表中只有一個分區。
感謝羅伯託, 但你能幫我理解'x'是什麼意思嗎? – prabudk
查看原始電子郵件,您可以從http://mail-archives.apache.org/mod_mbox/hive-user/201204.mbox/%[email protected]獲取公式。 yahoo.com%3E: >我稱x(> 1)爲「保守主義的因素」。較高的x意味着您通過更大數量的桶(並承載 –