2016-06-09 33 views
2

我通過從源代碼構建安裝tensorflow 0.8。 我使用具有4個GPU的AWS EC2 g2.8xlarge實例。 我試圖在這裏運行tensorflow分佈MNIST測試,代碼: https://github.com/tensorflow/tensorflow/blob/master/tensorflow/tools/dist_test/scripts/dist_mnist_test.sh無法運行tensorflow分佈式MNIST測試

我的腳本:

bash dist_mnist_test.sh "grpc://localhost:2223 grpc://localhost:2224" 

,我得到這個消息:

E0609 14:53:07.430440599 62872 tcp_client_posix.c:173]  failed to connect to 'ipv4:127.0.0.1:2223': socket error: connection refused 
E0609 14:53:07.445297934 62873 tcp_client_posix.c:173]  failed to connect to 'ipv4:127.0.0.1:2224': socket error: connection refused 

任何一個知道這裏有什麼問題?非常感謝!

回答

2

此腳本不能獨立運行。特別是,它期望您創建了一個TensorFlow集羣,其中運行腳本的之前的每個地址都運行create_tf_cluster.sh腳本可以使用Kubernetes設置此類羣集。 dist_test.sh腳本端到端運行這些腳本。

請參閱my answer您的其他問題,其中有一個建議腳本在分佈式TensorFlow上運行MNIST。

+0

非常感謝您的回答! – xyd