我有一組日期分區表employee_wages_<date>
,並且想要使用數據流來閱讀一些列。在(Python的例子)的線有些事情日期分區表上的BigQuerySource
beam.io.Read('ReadNameAndTotalSalary',
beam.io.BigQuerySource(query='SELECT user_name, sum(salary) as total_salary FROM `project_id.dataset_id.employee_salary_*` group by 1'))
對谷歌大查詢的查詢做工精細,但我得到和錯誤說無效的表名,當我運行的管道。也許我正在做一些非常愚蠢的事情,或者不可能在df中使用glob(*)?
查詢由BigQuery處理,而不是由Dataflow處理 - Dataflow僅將其結果導入到管道中。您是否能夠從BigQuery UI手動成功執行相同的查詢? – jkff
此查詢看起來像使用標準SQL,並且數據流可能默認使用傳統SQL。 –
@Mosha ...同意並且數據流支持非遺留(標準)sql嗎? –