2016-06-09 34 views

回答

2

在OSCON和PYCON最近的車間(slides)覆蓋(除其他事項外)上Kubernetes運行的分佈式TensorFlow。有一個GitHub repository包括必要的配置腳本和可用於與羣集交互的Jupyter筆記本。

有關更多詳細信息,請參閱研討會,但其基本思想是主控人員,每個工作人員和每個參數服務器在大小爲1的單獨Kubernetes複製控制器中運行。Kubernetes爲每個進程提供穩定的名稱,可以用來構建一個tf.train.ClusterSpec,並互連不同的進程。

還有其他的方法來建立一個集羣,這需要更多的配置,但本教程給出了一個很好的介紹,以一個word2vec模型建立同步訓練。

相關問題