2017-08-15 64 views
0

我正在安裝HBase 1.1.2和Phoenix 4.7 Hortonworks數據平臺2.6羣集。鳳凰視圖爲巨大的HBase表

我有一個巨大的HBase表,有很多列,如果添加新數據(數據由HBase API的Put機制添加),有時會添加新列。

現在我想使用鳳凰這個表。我發現本教程,我必須創建一個基於HBase表格結構的單獨Phoenix視圖:https://khodeprasad.wordpress.com/2016/07/26/how-to-use-existing-hbase-table-in-apache-phoenix/

基於本教程,我必須列出所有列族和列(!現在還在增加),那麼這將是很多工作,如果將新列添加到HBase表中,視圖將不會保持最新。

現在,這裏我的問題是:

  1. 是否有意義使用鳳凰城如此巨大的表,也可以隨時間變化?
  2. 有沒有一種方法可以創建類似於自動適合HBase列的「動態」Phoenix視圖?
+0

您可能想要看看只讀視圖https://phoenix.apache.org/views.html。 Phoenix對海量數據集相當不錯,但是......你應該用一個視圖來分析你的數據模型。這是確定的唯一方法。如果它只是一張表,我認爲它會比SELECT/JOIN執行得更好 –

回答

0

Phoenix可以很好地處理隨着時間變化的巨大表格。如果稍後添加列,則可以更改只讀視圖並添加列。 phoenix視圖將追溯顯示來自該列的所有數據。沒有辦法創建一個動態視圖,就像你可以在SQL中使用SQL(即CREATE VIEW查看AS SELECT * FROM TABLE)一樣,無需編寫自己的Java程序來創建並保持列的最新狀態