2015-05-31 47 views
1

我有包含大量記錄(39885593)的imapla表,並且需要通過Tableau使用impala表創建儀表板。使用Impala作爲數據源創建Tableau儀表板

我試圖acheive以多種方式這一要求,如下

1)提取的帕拉從表中的數據在的Tableau提取物,然後創建所述儀表板。 2)最初使用數據提取,然後將連接切換到實時連接 3)實時連接

方法1:可以使用數據提取創建儀表板。給出好的表現。這個應用程序的問題是數據是每天都在增長的事務數據,所以如果我通過這種方法進行數據提取,將會在Tableau Server中佔用更多空間。

方法2:使用此方法可以高效地設計儀表板,但是當我從數據提取切換到實時並將發佈儀表板時,發佈儀表板時也需要大量時間來發布儀表板,當我通過Tableau服務器查看儀表板時在瀏覽器中打開儀表盤需要更多時間。

方法3:實時連接在設計和發佈儀表板時性能非常低。

如果有人遇到過這種requiremnt請給我提供相同的建議。

感謝

回答

0

你說的實時連接使性能下降,也許你可以嘗試把成的Tableau之前自定義SQL查詢聚合在因帕拉的數據?

0

除非你需要最新的實時訪問數以百萬計的交易記錄,我推薦用提取物(可能的多提取物)工作

但是你提取物的尺寸減小到用以支持可視化所需的最低。您可以添加數據源過濾器,隱藏未使用的字段,累積數據以在摘錄中聚合到視圖所需的詳細程度。

對於大型數據集,不要嘗試製作只是整個數據集副本的單個數據集,製作多個小數據集,每個數據集只支持一個(或一組小)相關所需的信息觀點。想象一個像物化視圖的提取物。

如果視圖只顯示100標誌,然後力爭有100只在它使用的提取記錄,即使這些都是100點的記錄總結的基礎數據源從1億信息。

然後你就可以有更大的提取物,甚至活源供人下鑽成(過濾)詳細視圖時使用,而且儀表板的第一視圖可以快速啓動。

這種方式的交互性,刷新和發佈可以很快。

對於這種方法來工作,你可能需要習慣了在工作簿中的多個數據源,即使是基於相同的數據庫上。還可以使用篩選器操作,參數和計算字段來篩選和鏈接數據源。

+0

感謝亞歷克斯的建議,它確實幫助我進入下一步... –

相關問題