2016-09-16 68 views
0

經過一番研究,我發現Google雲端API說您應該使用Pipeline.create(PipelineOptions)而不是DataflowPipeline.create(DataflowPipelineOptions),但它不能解釋原因。任何人都可以爲我澄清這一點?DataflowPipeline和DataflowPipelineOptions與管道和管道選項

此外,後續問題,使用Pipeline.create(DataflowPipelineOptions)還運行管道工程時,有沒有什麼好的理由不,而不是屬性DataflowPipelineOptions已經有了,比如項目重新實現PipelineOptions

回答

0

PipelineOptions是一個特殊的類,旨在同時擁有多種選項的集合。 DataflowPipelineOptions只是它可以容納的選項的子集之一,但是當提及選項的完整集合時,將其稱爲PipelineOptions更有意義,因爲它是一個更一般和抽象的概念,即使它是相同的對象作爲DataflowPipelineOptions

PipelineOptions甚至不是數據流特定的;部分原因是管道可以使用數據流以外的運行程序運行,如Spark和Flink,它們都有自己的選項。希望這會回答你的第二個問題。

詳情請參閱Specifying execution parameters