1
我需要在流水線獲取其輸入數據之前清除表格,我希望這一步作爲管道本身的一部分在雲中運行,而不是在本地運行。Google Dataflow中的流水線初始化步驟
這是代碼看起來像此刻什麼,clearTable()
運行在本地:
exactTargetIntegration.clearTable(); // runs locally
Pipeline p = Pipeline.create(options);
PCollection<String> readFromFile =
p.apply(TextIO.Read.from(INPUT_FILES)); // runs in the cloud
...
這可能嗎?