我們打算從CDH3遷移到CDH4,因爲這種遷移,我們還計劃把HBASE進入了系統,因爲它也對數據的更新的一部分,CDH3我們正在使用Hive作爲倉庫。如何創建分區在HBase的表像蜂巢表分區
這裏我們在遷移時遇到了主要問題,Hive支持分區到表。我們的系統有許多不同架構的表格,有些表格的分區基於日期,我們有過去5年的數據歷史(某些表格中存在365 * 5個分區)。
我們要做到在HBase的相同的行爲也,當我瀏覽我無法找到在HBase的創建分區的解決方案。任何人都可以幫助我實現這個在HBase中創建表的過程。
我們要去HBASE的原因是,它支持更新。
如果HBASE不支持其他(如MangoDB,Cassandra)支持我們的行爲。
如果我們至少可以找到解決方案的一些解決方案,那麼它非常有幫助。
很高興見到您的回覆,但有一天,我們幾乎10+數百萬條記錄,所以我們希望有明智的一天分區,這將創造這麼多列家族,這不是一個好的設計。我們正在爲每個模式尋找明智的分區。有什麼辦法嗎? – GHK
好點。讓我想一會兒... – Tariq
如果將這些記錄中的每一個記錄作爲一行,rowkey將以某一特定日爲前綴,那麼會出現什麼情況? – Tariq