0
是否可以在Google Cloud Dataproc上編譯和構建自定義Apache Spark?可以說我們想調整Apace Spark,然後想在dataproc上構建自定義的Spark。在Dataproc上運行自定義的spark構建?
是否可以在Google Cloud Dataproc上編譯和構建自定義Apache Spark?可以說我們想調整Apace Spark,然後想在dataproc上構建自定義的Spark。在Dataproc上運行自定義的spark構建?
這應該是可以的。 Dataproc爲您提供正常的計算引擎虛擬機,並設置Hadoop和YARN。
您可以登錄到任何機器,安裝您自定義的火花編譯並指定YARN和Hadoop安裝(Dataproc)。但是,我懷疑你能夠使用GCP控制檯或dataproc命令行界面來提交和監視作業,而無需進一步修改。
您可能想要使用init操作來確保所有節點都使用您的火花版本,而不是嘗試加載預安裝的火花。初始化操作基本上是在所有節點上運行的任意腳本。 https://cloud.google.com/dataproc/docs/concepts/configuring-clusters/init-actions –