2016-04-22 64 views
2

我有一個已加載到BigQuery中的數據集,它包含3個獨立的表,每個文件中都有一個公共標識符。在連接到BigQuery時永久性地在Tableau中可視化數據

當我在Tableau中設置項目時,我在兩個表上執行了內連接。我將連接設置爲摘錄而不是直播。

我的文件中有一些地理信息,lats和longs。當我將lat拖動到工作表上的行部分時,它執行該任務需要一個永久性,目前需要18分鐘時間,並計算在將lat拖動到行部分時處理所做的任何操作。

有沒有其他一些方法可以隨機抽取我的數據進行處理,而不必等待每個查詢處理?我的數據甚至沒有那麼大,大約有1M行。

回答

3

我發現Tableau在100萬行之前停滯了很長時間,並且我忘記了連接會爲您解決問題。

在進行提取之前,儘可能在BigQuery中進行彙總,這是您的朋友。隨機摘錄也是一個好主意。您可以嘗試:

SELECT 
     * 
    FROM 
     ([subquery joining your tables]) 
    WHERE RAND() < 0.05 # or whatever gives an acceptable sample size