我們正面臨流表上BigQuery範圍裝飾器的問題。範圍裝飾查詢給出重複的數據。BigQuery範圍裝飾器重複問題
我的情況:
我BQ表定期從客戶事件進行流插入獲取數據。另一項工作是使用範圍修飾器週期性地從表中獲取時間綁定數據並將其發送到數據流作業。像
首次採用
SELECT * FROM [project_id:[email protected]]
,當我跑這個查詢有91條記錄取出由表中的所有數據..
後15分鐘另一個查詢基於上次間隔
SELECT * FROM [[email protected]]
這也給出了與91條記錄相同的結果。
但是我試圖再次運行相同的查詢,以交叉檢查
SELECT * FROM [project_id:[email protected]]
給出空數據。
對此有幫助嗎?
感謝您的詳細解答,由於價格限制,我們沒有使用流式數據流。順便說一句,我們選擇了這個場景的加載作業。 – shivg
根據你的約束,一個合理的選擇!結合其他事情提及:1)每天有加載作業限制,所以只要確保適當限制你的加載速度。否則,您可能會在一天中的後半部分出現配額失敗。 2)如果你不想查詢最新的數據,有一個表裝飾器可以與時間範圍裝飾器(tablename @ 123-456%-s)結合使用,它將從流緩衝區中省略數據。 –