目前,沒有辦法自動爲表格添加時間戳,儘管這是我們正在考慮的功能。
你說你的源文件太大了,無法在放入雲存儲之前編輯......這是否意味着整個源文件應該有相同的時間戳?如果是這樣,您可以導入到沒有時間戳的新BigQuery表,然後運行基本上覆製表的查詢,但添加時間戳。例如,SELECT all,fields, CURRENT_TIMESTAMP() FROM my.temp_table
(您可能希望使用allow_large_results併爲該查詢設置目標表)。如果你想變得有點棘手,你可以使用數據集。 DATASET僞表可以獲取表的修改時間,然後將其作爲列添加到表中,無論是在單獨的查詢中還是在JOIN中。這裏是你如何使用DATASET僞表來獲取最後修改時間:
SELECT MSEC_TO_TIMESTAMP(last_modified_time) AS time
FROM [publicdata:samples.__DATASET__]
WHERE table_id = 'wikipedia'
另一種選擇要考慮的是BigQuery的流API(更多信息here)。這使您只需將單行或一組行插入到表中,只需將它們直接發佈到bigquery即可。這可以爲您節省幾個步驟。
根據您打算如何查詢數據以及您有多少輸入源創建每日表格是一個合理的選項。如果這將使您的查詢跨越數百個表格,那麼您可能會看到糟糕的性能。請注意,如果您需要時間戳,因爲您想將查詢限制在特定的日期,並且這些日期在最近7天內,則可以使用時間範圍裝飾器(記錄here)。
謝謝!這有助於。我將研究這些選項。 –