2016-07-13 83 views
8

我試圖在EMR/EC2集羣上運行分佈式tensorflow,但我不知道如何在集羣中指定不同的實例來運行部分代碼。如何在AWS羣集上運行TensorFlow?

在文檔中,他們使用tf.device("/gpu:0")來指定一個gpu。但是如果我有一個主CPU和5個不同的從GPU實例在EMR集羣中運行,並且我想指定這些GPU來運行某些代碼?我無法輸入tf.device()與實例的公共DNS名稱,因爲它會引發錯誤,指出名稱無法解析。

回答

0

由於您的問題,AWS已經發布了一些代碼來簡化EC2集羣上分佈式TensorFlow的使用。

看到這個github repository。一切都在README.md描述,但本短篇小說的是,它會創建一個AWS與

  • 安全組堆疊
  • 彈性文件系統
  • EC2與AWS深度學習AMI實例和EFS安裝
  • 將配置EC2實例,以便您可以通過在主節點上運行命令輕鬆運行分佈式張量流運行(請參閱在TensorFlow上運行分佈式培訓部分)。